змија-dqn како пат до ML

Программирование

Пронајдено во tensorflow-js она што ви треба за првите чекори во ML и тргувањето.

Ова е обука за dqn каде што се доделуваат награди и казни на агентот за акции.

https://github.com/tensorflow/tfjs-examples/tree/master/snake-dqn

https://storage.googleapis.com/tfjs-examples/snake-dqn/index.html

Излегува дека имаме змија која учи од сопственото искуство да се движи. Таа има одреден број на потези (врти или продолжи) и нејзината задача е да дојде до плодот. Во почетокот змијата не знае како, но во текот на тренинзите добива способност да наоѓа плодови и да избегнува. Тоа е многу слично на тргувањето, нели?

Па, барем за нашата задача, кога имаме податоци кои работат, а роботот треба да донесе одлука за купување или продавање.

Минусот на змијата е што е напишан за node.js и треба да можеме да тренираме во прелистувачот (за да може секој корисник да го направи тоа). Затоа, истото мораше да се направи и за клиентот.

Ја влечев змијата како што е на мојата страница со графикон и се обидов да ја лансирам. Не беше таму!

Змијата возврати

прво пакувања,

потоа аргументи. (патем, јас исто така направив барање за повлекување до поправката https://github.com/tensorflow/tfjs-examples/pull/353),

потоа %%Unhandled Rejection (TypeError): Не може да се повика класа како функција%%. Што се поправа овде https://github.com/tensorflow/tfjs/pull/3906/files, но бидејќи Сè уште нема ослободување, па морав да го заменам со моите раце. Тука, патем, многу луѓе имаат проблем https://github.com/tensorflow/tfjs/issues/3384.

Малолетниците веќе отидоа подалеку, како замена на работата од fs со indexeddb. Работа со која шпионирав овде, патем. Па, генерално, количката-пол првично ме инспирираше да направам сè за клиентот.

https://github.com/tensorflow/tfjs-examples/tree/master/cart-pole

https://storage.googleapis.com/tfjs-examples/cart-pole/dist/index.html

на крајот, еве што се случи:

https://github.com/pskucherov/opexflow/pull/16/files

Па, всушност, следниот чекор ќе биде:

  1. Соодветни на графиконите
  2. Визуелизација
  3. Обучете го роботот на познати податоци за да го покаже максималниот резултат

Подолу е видео демо за работа-обука на роботи на клиентот. Еден ден ќе тргуваат и со фјучерси на Сбербанк наместо мене.

pskucherov
Rate author
Add a comment