slang-dqn as die pad na ML

Программирование

Gevind in tensorflow-js wat jy nodig het vir die eerste stappe in ML en handel.

Dit is dqn opleiding waar belonings en strawwe aan die agent gegee word vir optrede.

https://github.com/tensorflow/tfjs-examples/tree/master/snake-dqn

https://storage.googleapis.com/tfjs-examples/snake-dqn/index.html

Dit blyk dat ons ‘n slang het wat uit eie ervaring leer om te beweeg. Sy het ‘n sekere aantal bewegings (draai of gaan voort) en haar taak is om by die vrug uit te kom. Aanvanklik weet die slang nie hoe nie, maar in die loop van opleiding kry hy die vermoë om vrugte te vind en te ontduik. Dit is baie soortgelyk aan handel, is dit nie?

Wel, ten minste vir ons taak, wanneer ons data aan die gang het, en die robot moet ‘n besluit neem om te koop of te verkoop.

Die minus van die slang is dat dit vir node.js geskryf is, en ons moet in die blaaier kan oefen (sodat enige gebruiker dit kan doen). Daarom moes dieselfde op die kliënt gedoen word.

Ek het die slang soos dit is na my bladsy gesleep met ‘n grafiek en probeer om dit te lanseer. Dit was nie daar nie!

Die slang het teruggeveg

eers pakkies,

dan argumente. (terloops, ek het ook ‘n trekversoek langs die regstelling gemaak https://github.com/tensorflow/tfjs-examples/pull/353),

dan %%Onbehandelde Verwerping (TypeError): Kan nie ‘n klas as ‘n funksie noem nie%%. Wat hier herstel word https://github.com/tensorflow/tfjs/pull/3906/files, maar sedert Daar is nog geen vrystelling nie, so ek moes dit met my hande vervang. Hier, terloops, baie mense het ‘n probleem https://github.com/tensorflow/tfjs/issues/3384.

Minderjariges het reeds verder gegaan, soos om werk van fs met indexeddb te vervang. Werk waarmee ek hier gespioeneer het, terloops. Wel, oor die algemeen het kar-paal my aanvanklik geïnspireer om alles op die kliënt te doen.

https://github.com/tensorflow/tfjs-examples/tree/master/cart-pole

https://storage.googleapis.com/tfjs-examples/cart-pole/dist/index.html

op die ou end is dit wat gebeur het:

https://github.com/pskucherov/opexflow/pull/16/files

Wel, eintlik sal die volgende stap wees:

  1. Pas by kaarte
  2. Visualisering
  3. Lei die robot op bekende data om die maksimum resultaat te wys

Hieronder is ‘n video-demo van die werkopleiding van robotte op die kliënt. Eendag sal hulle ook Sberbank-termynkontrakte in plaas van my verhandel.

pskucherov
Rate author
Add a comment