snake-dqn ca cale către ML

Программирование

Găsiți în tensorflow-js ceea ce aveți nevoie pentru primii pași în ML și tranzacționare.

Acesta este antrenamentul dqn, în care agentul primește recompense și penalități pentru acțiuni.

https://github.com/tensorflow/tfjs-examples/tree/master/snake-dqn

https://storage.googleapis.com/tfjs-examples/snake-dqn/index.html

Se pare că avem un șarpe care învață din propria experiență să se miște. Are un anumit număr de mișcări (întoarce sau continuă) și sarcina ei este să ajungă la fruct. Inițial, șarpele nu știe să facă nimic, dar în cursul antrenamentului capătă capacitatea de a găsi fructe și de a se eschiva. Foarte asemănător cu tranzacționarea, nu-i așa?

Ei bine, cel puțin pentru sarcina noastră, când avem date în funcțiune, iar robotul trebuie să ia o decizie de cumpărare sau vânzare.

Dezavantajul șarpelui este că a fost scris pentru node.js și trebuie să ne putem antrena într-un browser (astfel încât orice utilizator să o poată face). Prin urmare, a fost necesar să începeți același lucru pe client.

Am dus șarpele așa cum este pe pagina mea cu graficul și am încercat să-l pornesc. Nu a fost așa!

Șarpele a rezistat în toate felurile posibile,

pachetele în primul rând,

apoi argumente. (apropo, am făcut și o cerere de extragere lângă remedierea https://github.com/tensorflow/tfjs-examples/pull/353),

apoi %% Respingere netratată (TypeError): Nu se poate apela o clasă ca funcție %%. Care este reparat aici https://github.com/tensorflow/tfjs/pull/3906/files, dar din moment ce nu există încă nicio eliberare, atunci a trebuit să-mi înlocuiesc mâinile. Aici, apropo, mulți oameni au o problemă https://github.com/tensorflow/tfjs/issues/3384.

Apoi au fost minorii, cum ar fi înlocuirea fs cu indexeddb. Munca cu care am spionat aici, de altfel. Ei bine, în general, cart-pole a inspirat inițial să facă totul pe client.

https://github.com/tensorflow/tfjs-examples/tree/master/cart-pole

https://storage.googleapis.com/tfjs-examples/cart-pole/dist/index.html

pana la urma, asa s-a intamplat:

https://github.com/pskucherov/opexflow/pull/16/files

Ei bine, asta e tot, următoarea etapă va fi:

  1. Se potrivesc cu diagrame
  2. Vizualizarea
  3. Antrenați un robot pe datele cunoscute pentru a afișa rezultatul maxim

Mai jos în videoclip este o demonstrație a pregătirii de lucru a roboților pe client. Într-o zi, ei vor tranzacționa și contracte futures Sberbank în locul meu.

pskucherov
Rate author
Add a comment