Gjetur në tensorflow-js atë që ju nevojitet për hapat e parë në ML dhe tregtim.
Ky është një trajnim dqn ku agjentit i jepen shpërblime dhe ndëshkime për veprimet.
https://github.com/tensorflow/tfjs-examples/tree/master/snake-dqn
https://storage.googleapis.com/tfjs-examples/snake-dqn/index.html
Rezulton se kemi një gjarpër që mëson nga përvoja e tij të lëvizë. Ajo ka një numër të caktuar lëvizjesh (kthesë ose vazhdon) dhe detyra e saj është të arrijë te fryti. Fillimisht, gjarpri nuk e di se si, por gjatë stërvitjes fiton aftësinë për të gjetur fruta dhe për t’u shmangur. Është shumë e ngjashme me tregtimin, apo jo?
Epo, të paktën për detyrën tonë, kur kemi të dhëna të ekzekutuara dhe roboti duhet të marrë një vendim për të blerë ose shitur.
Minusi i gjarprit është se është shkruar për node.js, dhe ne duhet të jemi në gjendje të stërvitemi në shfletues (në mënyrë që çdo përdorues ta bëjë këtë). Prandaj, e njëjta gjë duhej bërë edhe me klientin.
E tërhoqa zvarrë gjarpërin ashtu siç është në faqen time me një tabelë dhe u përpoqa ta lëshoja. Nuk ishte aty!
Gjarpri u kundërpërgjigj
së pari paketat,
pastaj argumentet. (nga rruga, bëra gjithashtu një kërkesë tërheqjeje pranë rregullimit https://github.com/tensorflow/tfjs-examples/pull/353),
atëherë %%Refuzim i patrajtuar (TypeError): Nuk mund të thërrasë një klasë si funksion%%. E cila po riparohet këtu https://github.com/tensorflow/tfjs/pull/3906/files, por që Nuk ka ende asnjë lëshim, kështu që më duhej ta zëvendësoja me duart e mia. Këtu, meqë ra fjala, shumë njerëz kanë një problem https://github.com/tensorflow/tfjs/issues/3384.
Të miturit kanë shkuar tashmë më tej, si zëvendësimi i punës nga fs me indexeddb. Puna me të cilën kam spiunuar këtu, meqë ra fjala. Epo, në përgjithësi, karroca më frymëzoi fillimisht të bëja gjithçka për klientin.
https://github.com/tensorflow/tfjs-examples/tree/master/cart-pole
https://storage.googleapis.com/tfjs-examples/cart-pole/dist/index.html
në fund, kjo është ajo që ndodhi:
https://github.com/pskucherov/opexflow/pull/16/files
Epo, në fakt, hapi tjetër do të jetë:
- Përshtatet me grafikët
- Vizualizimi
- Trajnoni robotin mbi të dhënat e njohura për të treguar rezultatin maksimal
Më poshtë është një video demo e trajnimit të punës së robotëve tek klienti. Një ditë ata do të tregtojnë edhe të ardhme të Sberbank në vend të meje.