gjarpër-dqn si rruga për në ML

Программирование

Gjetur në tensorflow-js atë që ju nevojitet për hapat e parë në ML dhe tregtim.

Ky është një trajnim dqn ku agjentit i jepen shpërblime dhe ndëshkime për veprimet.

https://github.com/tensorflow/tfjs-examples/tree/master/snake-dqn

https://storage.googleapis.com/tfjs-examples/snake-dqn/index.html

Rezulton se kemi një gjarpër që mëson nga përvoja e tij të lëvizë. Ajo ka një numër të caktuar lëvizjesh (kthesë ose vazhdon) dhe detyra e saj është të arrijë te fryti. Fillimisht, gjarpri nuk e di se si, por gjatë stërvitjes fiton aftësinë për të gjetur fruta dhe për t’u shmangur. Është shumë e ngjashme me tregtimin, apo jo?

Epo, të paktën për detyrën tonë, kur kemi të dhëna të ekzekutuara dhe roboti duhet të marrë një vendim për të blerë ose shitur.

Minusi i gjarprit është se është shkruar për node.js, dhe ne duhet të jemi në gjendje të stërvitemi në shfletues (në mënyrë që çdo përdorues ta bëjë këtë). Prandaj, e njëjta gjë duhej bërë edhe me klientin.

E tërhoqa zvarrë gjarpërin ashtu siç është në faqen time me një tabelë dhe u përpoqa ta lëshoja. Nuk ishte aty!

Gjarpri u kundërpërgjigj

së pari paketat,

pastaj argumentet. (nga rruga, bëra gjithashtu një kërkesë tërheqjeje pranë rregullimit https://github.com/tensorflow/tfjs-examples/pull/353),

atëherë %%Refuzim i patrajtuar (TypeError): Nuk mund të thërrasë një klasë si funksion%%. E cila po riparohet këtu https://github.com/tensorflow/tfjs/pull/3906/files, por që Nuk ka ende asnjë lëshim, kështu që më duhej ta zëvendësoja me duart e mia. Këtu, meqë ra fjala, shumë njerëz kanë një problem https://github.com/tensorflow/tfjs/issues/3384.

Të miturit kanë shkuar tashmë më tej, si zëvendësimi i punës nga fs me indexeddb. Puna me të cilën kam spiunuar këtu, meqë ra fjala. Epo, në përgjithësi, karroca më frymëzoi fillimisht të bëja gjithçka për klientin.

https://github.com/tensorflow/tfjs-examples/tree/master/cart-pole

https://storage.googleapis.com/tfjs-examples/cart-pole/dist/index.html

në fund, kjo është ajo që ndodhi:

https://github.com/pskucherov/opexflow/pull/16/files

Epo, në fakt, hapi tjetër do të jetë:

  1. Përshtatet me grafikët
  2. Vizualizimi
  3. Trajnoni robotin mbi të dhënat e njohura për të treguar rezultatin maksimal

Më poshtë është një video demo e trajnimit të punës së robotëve tek klienti. Një ditë ata do të tregtojnë edhe të ardhme të Sberbank në vend të meje.

pskucherov
Rate author
Add a comment