snake-dqn az ML elérési útjaként

Программирование

A tensorflow-js-ben megtalálta, amire szüksége van az ML és a kereskedés első lépéseihez.

Ez egy dqn tréning, ahol az ügynök jutalmat és büntetést kap a tetteiért.

https://github.com/tensorflow/tfjs-examples/tree/master/snake-dqn

https://storage.googleapis.com/tfjs-examples/snake-dqn/index.html

Kiderült, hogy van egy kígyónk, amely saját tapasztalataiból tanul meg mozogni. Van egy bizonyos számú lépése (forduljon vagy folytassa), és az a feladata, hogy elérje a gyümölcsöt. Kezdetben a kígyó nem tud semmit, de a kiképzés során képessé válik arra, hogy gyümölcsöt találjon és kitérjen. Nagyon hasonlít a kereskedéshez, nem?

Nos, legalábbis a mi feladatunkhoz, amikor már futnak az adatok, és a robotnak döntést kell hoznia a vásárlásról vagy eladásról.

A kígyó hátránya, hogy node.js-re íródott, és tudnunk kell oktatni böngészőben (hogy ezt bármelyik felhasználó meg tudja tenni). Ezért el kellett kezdeni ugyanezt az ügyfélen.

Átvittem a kígyót úgy ahogy van a grafikonnal ellátott oldalamra, és megpróbáltam elindítani. Nem így volt!

A kígyó minden lehetséges módon ellenállt,

először csomagok,

majd érvek. (egyébként a javítás mellett tettem lehívási kérelmet is https://github.com/tensorflow/tfjs-examples/pull/353),

majd %% Kezeletlen elutasítás (TypeError): Nem hívható meg egy osztály %% függvényként. Amit itt javítanak: https://github.com/tensorflow/tfjs/pull/3906/files, de mivel még nincs kiadás, akkor le kellett cserélnem a kezeimet. Itt egyébként sok embernek van problémája https://github.com/tensorflow/tfjs/issues/3384.

Aztán ott voltak a kiskorúak, például az indexeddb helyett fs-vel. A munka, amivel itt kémkedtem egyébként. Nos, általában a kocsirúd kezdetben arra ösztönzött, hogy mindent megtegyen az ügyfélen.

https://github.com/tensorflow/tfjs-examples/tree/master/cart-pole

https://storage.googleapis.com/tfjs-examples/cart-pole/dist/index.html

végül ez történt:

https://github.com/pskucherov/opexflow/pull/16/files

Nos, ez minden, a következő szakasz a következő lesz:

  1. Grafikonokhoz igazítás
  2. Megjelenítés
  3. Tanítson egy robotot ismert adatokra a maximális eredmény megjelenítéséhez

Az alábbi videóban a robotok kliensen végzett munka-képzésének bemutatója látható. Egyszer ők is kereskednek helyettem Sberbank határidős ügyletekkel.

pskucherov
Rate author
Add a comment