Fannt am tensorflow-js wat Dir braucht fir déi éischt Schrëtt am ML an Handel.
Dëst ass dqn Training wou Belounungen a Strofe dem Agent fir Handlungen ginn.
https://github.com/tensorflow/tfjs-examples/tree/master/snake-dqn
https://storage.googleapis.com/tfjs-examples/snake-dqn/index.html
Et stellt sech eraus datt mir eng Schlaang hunn déi aus senger eegener Erfahrung léiert sech ze beweegen. Si huet eng gewëssen Unzuel u Beweegungen (dréinen oder weidergoen) an hir Aufgab ass d’Fruucht ze kréien. Am Ufank weess d’Schlaang net wéi, awer am Laf vum Training kritt se d’Fäegkeet fir Friichten ze fannen an ze vermeiden. Et ass ganz ähnlech mam Handel, ass et net?
Gutt, op d’mannst fir eis Aufgab, wa mir Daten lafen, an de Roboter muss eng Entscheedung huelen fir ze kafen oder ze verkafen.
De Minus vun der Schlaang ass datt et fir node.js geschriwwe gëtt, a mir musse fäeg sinn am Browser ze trainéieren (sou datt all Benotzer et maache kann). Dofir huet datselwecht missen um Client gemaach ginn.
Ech hunn d’Schlaang wéi se op meng Säit mat engem Diagramm geschleeft huet a probéiert se ze lancéieren. Et war net do!
D’Schlaang huet sech zréckgekämpft
éischt Pak,
dann Argumenter. (iwwregens hunn ech och eng Pull-Ufro nieft der Fix gemaach https://github.com/tensorflow/tfjs-examples/pull/353),
dann %%Unhandled Rejection (TypeError): Kann eng Klass net als Funktioun nennen%%. Wat hei reparéiert gëtt https://github.com/tensorflow/tfjs/pull/3906/files, awer zënter Et gëtt nach keng Verëffentlechung, also hunn ech et mat mengen Hänn ze ersetzen. Hei, iwwregens, vill Leit hunn e Problem https://github.com/tensorflow/tfjs/issues/3384.
Mannerjäreger si scho méi wäit gaang, wéi d’Aarbecht vu fs duerch indexeddb z’ersetzen. Aarbecht mat där ech hei gespionéiert hunn, iwwregens. Gutt, am Allgemengen, Cart-Pole huet mech am Ufank inspiréiert alles op de Client ze maachen.
https://github.com/tensorflow/tfjs-examples/tree/master/cart-pole
https://storage.googleapis.com/tfjs-examples/cart-pole/dist/index.html
um Enn ass dat wat geschitt ass:
https://github.com/pskucherov/opexflow/pull/16/files
Gutt, tatsächlech wäert de nächste Schrëtt sinn:
- Passt op d’Charts
- Visualiséierung
- Trainéiert de Roboter op bekannten Donnéeën fir dat maximalt Resultat ze weisen
Drënner ass eng Video Demo vun der Aarbechtstraining vu Roboteren um Client. Irgendwann wäerten se och Sberbank-Futures amplaz mir handelen.