snake-dqn MLrako bidea bezala

Программирование

Tensorflow-js-en aurkitu da ML eta merkataritzako lehen urratsetarako behar duzuna.

Hau dqn prestakuntza da, non agenteari sariak eta zigorrak ematen zaizkion ekintzetarako.

https://github.com/tensorflow/tfjs-examples/tree/master/snake-dqn

https://storage.googleapis.com/tfjs-examples/snake-dqn/index.html

Ematen du bere esperientziatik mugitzen ikasten duen suge bat dugula. Mugimendu kopuru jakin bat du (biratu edo jarraitu) eta bere zeregina fruituetara iristea da. Hasieran, sugeak ez daki nola, baina entrenamenduan, fruituak aurkitzeko eta saihesteko gaitasuna lortzen du. Negoziazioarekin oso antzekoa da, ezta?

Tira, gure zereginerako behintzat, datuak martxan ditugunean, eta robotak erosteko edo saltzeko erabakia hartu behar du.

Sugearen kenak node.js-erako idatzita dagoela da, eta nabigatzailean entrenatu ahal izan behar dugu (edozein erabiltzailek egin dezan). Horregatik, gauza bera egin behar zen bezeroarekin.

Sugea dagoen bezala arrastatu nuen diagrama batekin nire orrialdera eta abiarazten saiatu nintzen. Ez zegoen han!

Sugeak borrokatu zuen

paketeak lehenik,

gero argudioak. (bide batez, tira eskaera bat ere egin nuen https://github.com/tensorflow/tfjs-examples/pull/353 konponketaren ondoan),

gero %%Maneatu gabeko errefusa (TypeError): Ezin da klase bati %% funtzio gisa deitu. Hemen konpontzen ari dena https://github.com/tensorflow/tfjs/pull/3906/files, baina geroztik Oraindik ez dago kaleratzerik, beraz, eskuekin ordezkatu behar izan nuen. Hemen, bide batez, jende askok arazo bat du https://github.com/tensorflow/tfjs/issues/3384.

Adingabeak urrunago joan dira dagoeneko, fs-en lana indexeddb-rekin ordezkatzea bezala. Hemen zelatatzen nuen lana, bide batez. Beno, oro har, cart-pole hasiera batean bezeroarengan dena egitera bultzatu ninduen.

https://github.com/tensorflow/tfjs-examples/tree/master/cart-pole

https://storage.googleapis.com/tfjs-examples/cart-pole/dist/index.html

azkenean, hauxe gertatu zen:

https://github.com/pskucherov/opexflow/pull/16/files

Beno, egia esan, hurrengo urratsa hau izango da:

  1. Egokitu zerrendetara
  2. Bistaratzea
  3. Entrenatu robota datu ezagunetan emaitza maximoa erakusteko

Behean roboten lan-prestakuntzaren bideo-demo bat dago bezeroarengan. Noizbait Sberbank etorkizunak ere negoziatuko dituzte ni ordez.

pskucherov
Rate author
Add a comment