slange-dqn som vej til ML

Программирование

Fandt i tensorflow-js, hvad du skal bruge til de første trin i ML og handel.

Dette er dqn træning, hvor agenten får belønninger og straf for handlinger.

https://github.com/tensorflow/tfjs-examples/tree/master/snake-dqn

https://storage.googleapis.com/tfjs-examples/snake-dqn/index.html

Det viser sig, at vi har en slange, der af egen erfaring lærer at bevæge sig. Hun har et vist antal træk (drej eller fortsæt), og hendes opgave er at komme til frugten. I starten ved slangen ikke, hvordan den skal gøre noget, men i løbet af træningen får den evnen til at finde frugter og undvige. Meget lig handel, er det ikke?

Nå, i hvert fald til vores opgave, når vi har data kørende, og robotten skal træffe en beslutning om at købe eller sælge.

Ulempen ved slangen er, at den er skrevet til node.js, og vi skal kunne træne i en browser (så enhver bruger kan gøre det). Derfor var det nødvendigt at starte det samme på klienten.

Jeg tog slangen som den er til min side med grafen og forsøgte at starte den. Sådan var det ikke!

Slangen gjorde modstand på alle mulige måder,

pakker først,

derefter argumenter. (i øvrigt lavede jeg også en pull-anmodning ved siden af ​​rettelsen https://github.com/tensorflow/tfjs-examples/pull/353),

derefter %% Ubehandlet afvisning (TypeError): Kan ikke kalde en klasse som en funktion %%. Som er repareret her https://github.com/tensorflow/tfjs/pull/3906/files, men siden der er ingen frigivelse endnu, så var jeg nødt til at erstatte mine hænder. Her har mange i øvrigt et problem https://github.com/tensorflow/tfjs/issues/3384.

Så var der de mindreårige, som at erstatte fs med indexeddb. Det arbejde, som jeg spionerede på her, forresten. Godt, generelt, cart-pole oprindeligt inspireret til at gøre alt på klienten.

https://github.com/tensorflow/tfjs-examples/tree/master/cart-pole

https://storage.googleapis.com/tfjs-examples/cart-pole/dist/index.html

i sidste ende er dette, hvad der skete:

https://github.com/pskucherov/opexflow/pull/16/files

Nå, det er alt, næste fase bliver:

  1. Tilpas til diagrammer
  2. Visualisering
  3. Træn en robot på kendte data for at vise det maksimale resultat

Nedenfor i videoen er en demo af arbejdstræning af robotter på klienten. En dag vil de også handle Sberbank-futures i stedet for mig.

pskucherov
Rate author
Add a comment