snake-dqn ML-ге апаратын жол ретінде

Программирование

Tensorflow-js ішінен ML және саудадағы алғашқы қадамдар үшін қажет нәрсені тапты.

Бұл агентке әрекеттері үшін сыйақылар мен айыппұлдар берілетін dqn тренингі.

https://github.com/tensorflow/tfjs-examples/tree/master/snake-dqn

https://storage.googleapis.com/tfjs-examples/snake-dqn/index.html

Бізде жылан қозғалуды өз тәжірибесінен үйренеді. Оның белгілі бір қозғалыс саны бар (бұрылу немесе жалғастыру) және оның міндеті – жеміске жету. Бастапқыда жылан қалай екенін білмейді, бірақ жаттығу барысында жемістерді тауып, жалтару қабілетіне ие болады. Бұл саудаға өте ұқсас, солай емес пе?

Кем дегенде, біздің тапсырмамыз үшін, бізде деректер жұмыс істеп тұрған кезде және робот сатып алу немесе сату туралы шешім қабылдауы керек.

Жыланның минусы – ол node.js үшін жазылған және біз браузерде жаттыға білуіміз керек (кез келген қолданушы жасай алатындай). Сондықтан клиентке де солай істеу керек болды.

Мен жыланды сол қалпында диаграммасы бар парақшама сүйреп апарып, оны іске қосуға тырыстым. Ол жерде болмады!

Жылан қарсы шықты

алдымен пакеттер,

содан кейін дәлелдер. (Айтпақшы, мен https://github.com/tensorflow/tfjs-examples/pull/353 түзетуінің жанында тарту сұрауын жасадым),

содан кейін %% өңделмеген бас тарту (TypeError): %% функциясы ретінде сыныпты шақыру мүмкін емес. Мұнда https://github.com/tensorflow/tfjs/pull/3906/files жөнделіп жатыр, бірақ содан бері Әзірге шығарылым жоқ, сондықтан оны қолыммен ауыстыруға тура келді. Айтпақшы, көптеген адамдарда https://github.com/tensorflow/tfjs/issues/3384 мәселесі бар.

Кәмелетке толмағандар жұмысты fs-тен indexeddb-ге ауыстыру сияқты әрі қарай жүріп кетті. Айтпақшы, мен осында тыңшылық жасаған жұмыс. Жалпы, арба-таяқ мені клиентте барлығын жасауға шабыттандырды.

https://github.com/tensorflow/tfjs-examples/tree/master/cart-pole

https://storage.googleapis.com/tfjs-examples/cart-pole/dist/index.html

соңында мынандай болды:

https://github.com/pskucherov/opexflow/pull/16/files

Ал, шын мәнінде, келесі қадам болады:

  1. Диаграммаларға сәйкестендіру
  2. Визуализация
  3. Максималды нәтиже көрсету үшін роботты белгілі деректерге үйретіңіз

Төменде клиенттегі роботтардың жұмысын үйретудің бейне демонстрациясы берілген. Бір күні олар да менің орныма Сбербанк фьючерстерін сатады.

pskucherov
Rate author
Add a comment