Schlaang-dqn als Wee op ML

Программирование

Fannt am tensorflow-js wat Dir braucht fir déi éischt Schrëtt am ML an Handel.

Dëst ass dqn Training wou Belounungen a Strofe dem Agent fir Handlungen ginn.

https://github.com/tensorflow/tfjs-examples/tree/master/snake-dqn

https://storage.googleapis.com/tfjs-examples/snake-dqn/index.html

Et stellt sech eraus datt mir eng Schlaang hunn déi aus senger eegener Erfahrung léiert sech ze beweegen. Si huet eng gewëssen Unzuel u Beweegungen (dréinen oder weidergoen) an hir Aufgab ass d’Fruucht ze kréien. Am Ufank weess d’Schlaang net wéi, awer am Laf vum Training kritt se d’Fäegkeet fir Friichten ze fannen an ze vermeiden. Et ass ganz ähnlech mam Handel, ass et net?

Gutt, op d’mannst fir eis Aufgab, wa mir Daten lafen, an de Roboter muss eng Entscheedung huelen fir ze kafen oder ze verkafen.

De Minus vun der Schlaang ass datt et fir node.js geschriwwe gëtt, a mir musse fäeg sinn am Browser ze trainéieren (sou datt all Benotzer et maache kann). Dofir huet datselwecht missen um Client gemaach ginn.

Ech hunn d’Schlaang wéi se op meng Säit mat engem Diagramm geschleeft huet a probéiert se ze lancéieren. Et war net do!

D’Schlaang huet sech zréckgekämpft

éischt Pak,

dann Argumenter. (iwwregens hunn ech och eng Pull-Ufro nieft der Fix gemaach https://github.com/tensorflow/tfjs-examples/pull/353),

dann %%Unhandled Rejection (TypeError): Kann eng Klass net als Funktioun nennen%%. Wat hei reparéiert gëtt https://github.com/tensorflow/tfjs/pull/3906/files, awer zënter Et gëtt nach keng Verëffentlechung, also hunn ech et mat mengen Hänn ze ersetzen. Hei, iwwregens, vill Leit hunn e Problem https://github.com/tensorflow/tfjs/issues/3384.

Mannerjäreger si scho méi wäit gaang, wéi d’Aarbecht vu fs duerch indexeddb z’ersetzen. Aarbecht mat där ech hei gespionéiert hunn, iwwregens. Gutt, am Allgemengen, Cart-Pole huet mech am Ufank inspiréiert alles op de Client ze maachen.

https://github.com/tensorflow/tfjs-examples/tree/master/cart-pole

https://storage.googleapis.com/tfjs-examples/cart-pole/dist/index.html

um Enn ass dat wat geschitt ass:

https://github.com/pskucherov/opexflow/pull/16/files

Gutt, tatsächlech wäert de nächste Schrëtt sinn:

  1. Passt op d’Charts
  2. Visualiséierung
  3. Trainéiert de Roboter op bekannten Donnéeën fir dat maximalt Resultat ze weisen

Drënner ass eng Video Demo vun der Aarbechtstraining vu Roboteren um Client. Irgendwann wäerten se och Sberbank-Futures amplaz mir handelen.

pskucherov
Rate author
Add a comment