ahas-dqn bilang landas sa ML

Программирование

Natagpuan sa tensorflow-js kung ano ang kailangan mo para sa mga unang hakbang sa ML at trading.

Ito ay dqn na pagsasanay kung saan ang mga gantimpala at mga parusa ay ibinibigay sa ahente para sa mga aksyon.

https://github.com/tensorflow/tfjs-examples/tree/master/snake-dqn

https://storage.googleapis.com/tfjs-examples/snake-dqn/index.html

May ahas pala tayo na natututo sa sarili nitong karanasan para gumalaw. Siya ay may isang tiyak na bilang ng mga gumagalaw (lumiko o magpatuloy) at ang kanyang gawain ay upang makuha ang prutas. Sa una, hindi alam ng ahas kung paano, ngunit sa kurso ng pagsasanay, nakakakuha ito ng kakayahang makahanap ng mga prutas at umigtad. Ito ay halos kapareho sa pangangalakal, hindi ba?

Well, hindi bababa sa para sa aming gawain, kapag mayroon kaming data na tumatakbo, at ang robot ay kailangang gumawa ng desisyon na bumili o magbenta.

Ang minus ng ahas ay isinulat ito para sa node.js, at kailangan nating makapagsanay sa browser (upang magawa ito ng sinumang user). Samakatuwid, ang parehong ay dapat gawin sa kliyente.

Kinaladkad ko ang ahas sa aking pahina na may isang tsart at sinubukang ilunsad ito. Wala ito doon!

Nanlaban ang ahas

package muna,

pagkatapos ay mga argumento. (nga pala, gumawa din ako ng pull request sa tabi ng pag-aayos https://github.com/tensorflow/tfjs-examples/pull/353),

pagkatapos ay %%Unhandled Rejection (TypeError): Hindi matawagan ang isang klase bilang isang function%%. Alin ang inaayos dito https://github.com/tensorflow/tfjs/pull/3906/files, ngunit mula noong Wala pang release, kaya kinailangan kong palitan ng mga kamay ko. Dito pala, maraming tao ang may problema https://github.com/tensorflow/tfjs/issues/3384.

Ang mga menor de edad ay lumayo na, tulad ng pagpapalit ng trabaho mula sa fs ng indexeddb. Trabaho kung saan ako natiktikan dito, nga pala. Well, sa pangkalahatan, ang cart-pole sa una ay nagbigay inspirasyon sa akin na gawin ang lahat sa kliyente.

https://github.com/tensorflow/tfjs-examples/tree/master/cart-pole

https://storage.googleapis.com/tfjs-examples/cart-pole/dist/index.html

sa huli, ito ang nangyari:

https://github.com/pskucherov/opexflow/pull/16/files

Sa totoo lang, ang susunod na hakbang ay:

  1. Angkop sa mga chart
  2. Visualization
  3. Sanayin ang robot sa kilalang data upang ipakita ang pinakamataas na resulta

Nasa ibaba ang isang video demo ng work-training ng mga robot sa kliyente. Balang araw ipagpapalit din nila ang Sberbank futures sa halip na ako.

pskucherov
Rate author