neidr-dqn fel llwybr i ML

Программирование

Wedi’i ddarganfod yn tensorflow-js yr hyn sydd ei angen arnoch chi ar gyfer y camau cyntaf mewn ML a masnachu.

Mae hwn yn hyfforddiant dqn, lle rhoddir gwobrau a chosbau i’r asiant am gamau.

https://github.com/tensorflow/tfjs-examples/tree/master/snake-dqn

https://storage.googleapis.com/tfjs-examples/snake-dqn/index.html

Mae’n ymddangos bod gennym neidr sy’n dysgu o’i phrofiad ei hun i symud. Mae ganddi nifer penodol o symudiadau (troi neu barhau) a’i thasg yw cyrraedd y ffrwyth. I ddechrau, nid yw’r neidr yn gwybod sut i wneud unrhyw beth, ond yn ystod yr hyfforddiant mae’n ennill y gallu i ddod o hyd i ffrwythau a osgoi. Yn debyg iawn i fasnachu, ynte?

Wel, o leiaf ar gyfer ein tasg, pan fydd gennym ddata’n rhedeg, ac mae angen i’r robot wneud penderfyniad i brynu neu werthu.

Anfantais y neidr yw iddi gael ei hysgrifennu ar gyfer node.js, ac mae angen i ni allu hyfforddi mewn porwr (fel y gall unrhyw ddefnyddiwr ei wneud). Felly, roedd angen cychwyn yr un peth ar y cleient.

Cymerais y neidr fel y mae i’m tudalen gyda’r graff a cheisio ei gychwyn. Nid oedd felly!

Gwrthwynebodd y neidr ym mhob ffordd bosibl,

pecynnau yn gyntaf,

yna dadleuon. (gyda llaw, gwnes i gais tynnu wrth ymyl yr atgyweiriad https://github.com/tensorflow/tfjs-examples/pull/353),

yna %% Gwrthod Heb ei drin (TypeError): Methu galw dosbarth fel swyddogaeth %%. Sy’n cael ei atgyweirio yma https://github.com/tensorflow/tfjs/pull/3906/files, ond ers hynny does dim rhyddhau eto, yna roedd yn rhaid i mi amnewid fy nwylo. Yma, gyda llaw, mae gan lawer o bobl broblem https://github.com/tensorflow/tfjs/issues/3384.

Yna roedd y plant dan oed, fel amnewid fs yn lle indexeddb. Y gwaith y bûm yn edrych arno yma, gyda llaw. Wel, yn gyffredinol, ysbrydolodd cart-polyn i wneud popeth ar y cleient i ddechrau.

https://github.com/tensorflow/tfjs-examples/tree/master/cart-pole

https://storage.googleapis.com/tfjs-examples/cart-pole/dist/index.html

yn y diwedd, dyma ddigwyddodd:

https://github.com/pskucherov/opexflow/pull/16/files

Wel, dyna i gyd, y cam nesaf fydd:

  1. Yn ffitio i siartiau
  2. Delweddu
  3. Hyfforddwch robot ar ddata hysbys i ddangos y canlyniad mwyaf

Isod yn y fideo mae arddangosiad o hyfforddiant gwaith robotiaid ar y cleient. Someday byddant hefyd yn masnachu dyfodol Sberbank yn lle fi.

pskucherov
Rate author
Add a comment