slange-dqn som vei til ML

Программирование

Fant i tensorflow-js det du trenger for de første trinnene i ML og handel.

Dette er dqn-trening, hvor agenten gis belønning og straff for handlinger.

https://github.com/tensorflow/tfjs-examples/tree/master/snake-dqn

https://storage.googleapis.com/tfjs-examples/snake-dqn/index.html

Det viser seg at vi har en slange som lærer av egen erfaring å bevege seg. Hun har et visst antall trekk (snu eller fortsett) og hennes oppgave er å komme til frukten. I utgangspunktet vet ikke slangen hvordan den skal gjøre noe, men i løpet av treningen får den muligheten til å finne frukt og unnslippe. Veldig lik handel, er det ikke?

Vel, i det minste for vår oppgave, når vi har data i gang, og roboten må ta en beslutning om å kjøpe eller selge.

Ulempen med slangen er at den ble skrevet for node.js, og vi må kunne trene i en nettleser (slik at enhver bruker kan gjøre det). Derfor var det nødvendig å starte det samme på klienten.

Jeg tok slangen som den er til siden min med grafen og prøvde å starte den. Det var ikke slik!

Slangen gjorde motstand på alle mulige måter,

pakker først,

deretter argumenter. (forresten, jeg har også laget en pull-forespørsel ved siden av rettelsen https://github.com/tensorflow/tfjs-examples/pull/353),

deretter %% Ubehandlet avvisning (TypeError): Kan ikke kalle en klasse som en funksjon %%. Som er reparert her https://github.com/tensorflow/tfjs/pull/3906/files, men siden det er ingen utgivelse ennå, da måtte jeg bytte hendene. Her er det forresten mange som har et problem https://github.com/tensorflow/tfjs/issues/3384.

Så var det mindreårige, som å erstatte fs med indexeddb. Arbeidet som jeg spionerte på her, forresten. Vel, generelt, cart-pole opprinnelig inspirert til å gjøre alt på klienten.

https://github.com/tensorflow/tfjs-examples/tree/master/cart-pole

https://storage.googleapis.com/tfjs-examples/cart-pole/dist/index.html

til slutt skjedde dette:

https://github.com/pskucherov/opexflow/pull/16/files

Vel, det er alt, neste trinn vil være:

  1. Tilpass til diagrammer
  2. Visualisering
  3. Tren en robot på kjente data for å vise maksimalt resultat

Nedenfor i videoen er en demo av arbeidstrening av roboter på klienten. En dag vil de også handle Sberbank-futures i stedet for meg.

pskucherov
Rate author
Add a comment