oray-dqn salaku jalur ka ML

Программирование

Kapanggih dina tensorflow-js naon anu anjeun peryogikeun pikeun léngkah munggaran dina ML sareng dagang.

Ieu latihan dqn dimana ganjaran jeung hukuman dibikeun ka agén pikeun lampah.

https://github.com/tensorflow/tfjs-examples/tree/master/snake-dqn

https://storage.googleapis.com/tfjs-examples/snake-dqn/index.html

Tétéla urang boga oray anu diajar tina pangalaman sorangan pikeun mindahkeun. Anjeunna ngagaduhan sababaraha gerakan (ngahurungkeun atanapi teraskeun) sareng tugasna nyaéta pikeun ngahontal buah. Awalna, oray teu nyaho kumaha carana, tapi dina kursus latihan, eta gains kamampuhan pikeun manggihan bungbuahan sarta Dodge. Sarua pisan sareng dagang, sanés?

Nya, sahenteuna pikeun tugas urang, nalika urang gaduh data jalan, sareng robot kedah nyandak kaputusan pikeun mésér atanapi ngajual.

The dikurangan oray téh nya éta ditulis pikeun node.js, sarta kami kudu bisa ngalatih dina browser nu (ku kituna sagala pamaké bisa ngalakukeun eta). Ku alatan éta, hal anu sami kedah dilakukeun dina klien.

Kuring nyeret oray éta ka halaman kuring kalayan bagan sareng nyobian ngaluncurkeunana. Ieu teu aya!

Oray ngalawan deui

pakét heula,

saterusna argumen. (Ngomong-ngomong, kuring ogé nyieun pamundut tarikan gigireun fix https://github.com/tensorflow/tfjs-examples/pull/353),

lajeng %% Panolakan Unhandled (TypeError): Teu bisa nelepon kelas salaku fungsi%%. Anu dilereskeun di dieu https://github.com/tensorflow/tfjs/pull/3906/files, tapi saprak Teu acan aya pelepasan, janten kuring kedah ngagentos ku panangan. Di dieu, ku jalan kitu, loba jalma boga masalah https://github.com/tensorflow/tfjs/issues/3384.

Budak leutik parantos langkung jauh, sapertos ngagentos padamelan ti fs sareng indexeddb. Gawe sareng nu kuring spied dieu, ku jalan. Muhun, sacara umum, cart-kutub mimitina diideuan kuring pikeun ngalakukeun sagalana on klien nu.

https://github.com/tensorflow/tfjs-examples/tree/master/cart-pole

https://storage.googleapis.com/tfjs-examples/cart-pole/dist/index.html

tungtungna, ieu anu lumangsung:

https://github.com/pskucherov/opexflow/pull/16/files

Nya, saleresna, léngkah salajengna nyaéta:

  1. Pas kana bagan
  2. Visualisasi
  3. Ngalatih robot dina data dipikawanoh pikeun nembongkeun hasil maksimum

Di handap ieu hiji demo video ngeunaan karya-latihan robot on klien nu. Someday aranjeunna ogé bakal dagangan futures Sberbank tinimbang kuring.

pskucherov
Rate author
Add a comment