snake-dqn as it paad nei ML

Программирование

Fûn yn tensorflow-js wat jo nedich binne foar de earste stappen yn ML en hannel.

Dit is dqn-training wêrby’t beleannings en boetes wurde jûn oan ‘e agint foar aksjes.

https://github.com/tensorflow/tfjs-examples/tree/master/snake-dqn

https://storage.googleapis.com/tfjs-examples/snake-dqn/index.html

It docht bliken dat wy in slang hawwe dy’t út eigen ûnderfining leart om te bewegen. Se hat in bepaald oantal bewegingen (draaie of trochgean) en har taak is om nei de frucht te kommen. Yn earste ynstânsje wit de slang net hoe, mar yn ‘e rin fan’ e training krijt it de mooglikheid om fruchten te finen en te ûntkommen. It is heul gelyk oan hannel, is it net?

No, op syn minst foar ús taak, as wy gegevens rinne, en de robot moat in beslút nimme om te keapjen of te ferkeapjen.

De minus fan ‘e slang is dat it is skreaun foar node.js, en wy moatte yn ‘e browser kinne traine (sadat elke brûker it kin dwaan). Dêrom moast itselde oan de klant dien wurde.

Ik sleepte de slang sa’t it is nei myn side mei in kaart en besocht it te lansearjen. It wie der net!

De slang focht werom

pakketten earst,

dan arguminten. (troch de manier, ik makke ek in pull-fersyk neist de fix https://github.com/tensorflow/tfjs-examples/pull/353),

dan %% Unbehannele ôfwizing (TypeError): Kin gjin klasse neame as funksje%%. Wat hjir wurdt reparearre https://github.com/tensorflow/tfjs/pull/3906/files, mar sûnt Der is noch gjin frijlitting, dus ik moast it ferfange mei myn hannen. Hjir, trouwens, in protte minsken hawwe in probleem https://github.com/tensorflow/tfjs/issues/3384.

Minderjierrigen binne al fierder gien, lykas it ferfangen fan wurk fan fs troch indexeddb. Wurk dêr’t ik hjir trouwens mei bispiede. No, yn it algemien, cart-pole ynspirearre my ynearsten om alles te dwaan op ‘e klant.

https://github.com/tensorflow/tfjs-examples/tree/master/cart-pole

https://storage.googleapis.com/tfjs-examples/cart-pole/dist/index.html

op it lêst is dit wat der bard:

https://github.com/pskucherov/opexflow/pull/16/files

No, eins sil de folgjende stap wêze:

  1. Fit to charts
  2. Fisualisaasje
  3. Trein de robot op bekende gegevens om it maksimale resultaat te sjen

Hjirûnder is in fideodemo fan ‘e wurktraining fan robots op’ e kliïnt. Eartiids sille se ek Sberbank-futures hannelje ynstee fan my.

pskucherov
Rate author
Add a comment