snake-dqn cum’è a strada di ML

Программирование

Truvate in tensorflow-js ciò chì avete bisognu per i primi passi in ML è trading.

Questu hè dqn training induve ricumpensa è penalità sò datu à l’agente per l’azzioni.

https://github.com/tensorflow/tfjs-examples/tree/master/snake-dqn

https://storage.googleapis.com/tfjs-examples/snake-dqn/index.html

Risulta chì avemu una serpente chì ampara da a so propria sperienza à move. Hà un certu nùmeru di muvimenti (gira o cuntinueghja) è u so compitu hè di ghjunghje à u fruttu. In principiu, a serpente ùn sapi micca cumu, ma in u cursu di furmazione, guadagna a capacità di truvà frutti è esquive. Hè assai simili à u cummerciu, ùn hè micca?

Eppo, almenu per u nostru compitu, quandu avemu dati in esecuzione, è u robot hà bisognu di piglià una decisione per cumprà o vende.

U minus di a serpente hè chì hè scrittu per node.js, è avemu bisognu di pudè furmà in u navigatore (per chì ogni utilizatore pò fà). Dunque, u listessu deve esse fattu nantu à u cliente.

Aghju trascinatu a serpente cum’è in a mo pagina cù un graficu è pruvatu à lancià. Ùn ci era micca !

U serpente hà ripugnatu

pacchetti prima,

poi argumenti. (Per via, aghju ancu fattu una dumanda di pull accantu à a correzione https://github.com/tensorflow/tfjs-examples/pull/353),

allora %% Rigettu Unhandled (TypeError): Ùn pò micca chjamà una classa cum’è una funzione%%. Chì hè esse riparatu quì https://github.com/tensorflow/tfjs/pull/3906/files, ma dapoi Ùn ci hè ancu una liberazione, cusì aghju avutu da rimpiazzà cù e mo mani. Quì, per via, assai persone anu un prublema https://github.com/tensorflow/tfjs/issues/3384.

I minori sò digià andati più luntanu, cum’è rimpiazzà u travagliu da fs cù indexeddb. U travagliu cù quale aghju spiatu quì, per via. Ebbè, in generale, cart-pole inizialmente m’hà inspiratu à fà tuttu nantu à u cliente.

https://github.com/tensorflow/tfjs-examples/tree/master/cart-pole

https://storage.googleapis.com/tfjs-examples/cart-pole/dist/index.html

in fine, questu hè ciò chì hè accadutu:

https://github.com/pskucherov/opexflow/pull/16/files

Ebbè, in realtà, u prossimu passu serà:

  1. Adatta à i grafici
  2. Visualizazione
  3. Train u robot nantu à dati cunnisciuti per vede u risultatu massimu

Quì sottu hè una video demo di u travagliu di furmazione di robots nantu à u cliente. Qualchì ghjornu anu ancu scambià futuri Sberbank invece di mè.

pskucherov
Rate author
Add a comment