Snake-dqn als Pfad zu ML

Программирование

In tensorflow-js finden Sie, was Sie für die ersten Schritte in ML und Trading benötigen.

Dies ist ein Dqn-Training, bei dem der Agent Belohnungen und Strafen für Aktionen erhält.

https://github.com/tensorflow/tfjs-examples/tree/master/snake-dqn

https://storage.googleapis.com/tfjs-examples/snake-dqn/index.html

Es stellt sich heraus, dass wir eine Schlange haben, die aus eigener Erfahrung lernt, sich zu bewegen. Sie hat eine bestimmte Anzahl von Zügen (drehe oder fahre weiter) und ihre Aufgabe ist es, an die Frucht zu kommen. Anfangs weiß die Schlange nicht, wie sie etwas tun soll, aber im Laufe des Trainings gewinnt sie die Fähigkeit, Früchte zu finden und auszuweichen. Dem Trading sehr ähnlich, nicht wahr?

Zumindest für unsere Aufgabe, wenn Daten laufen und der Roboter eine Kauf- oder Verkaufsentscheidung treffen muss.

Der Nachteil der Schlange ist, dass sie für node.js geschrieben wurde und wir in der Lage sein müssen, in einem Browser zu trainieren (damit jeder Benutzer dies tun kann). Daher war es notwendig, das gleiche auf dem Client zu starten.

Ich nahm die Schlange so wie sie ist auf meine Seite mit der Grafik und versuchte sie zu starten. Es war nicht so!

Die Schlange wehrte sich auf jede erdenkliche Weise,

Pakete zuerst,

dann Argumente. (Ich habe übrigens neben dem Fix https://github.com/tensorflow/tfjs-examples/pull/353) auch einen Pull-Request gemacht,

dann %% Unbehandelte Zurückweisung (TypeError): Eine Klasse kann nicht als Funktion %% aufgerufen werden. Was hier repariert wird https://github.com/tensorflow/tfjs/pull/3906/files, aber da es gibt noch keine Freigabe, dann musste ich meine Hände ersetzen. Hier haben übrigens viele ein Problem https://github.com/tensorflow/tfjs/issues/3384.

Dann waren da noch die Minderjährigen, wie das Ersetzen von fs für indexeddb. Die Arbeit, mit der ich hier übrigens ausspioniert habe. Nun, im Allgemeinen hat Cart-Pole anfangs dazu inspiriert, alles am Kunden zu tun.

https://github.com/tensorflow/tfjs-examples/tree/master/cart-pole

https://storage.googleapis.com/tfjs-examples/cart-pole/dist/index.html

am ende ist folgendes passiert:

https://github.com/pskucherov/opexflow/pull/16/files

Nun, das ist alles, die nächste Stufe wird sein:

  1. An Diagramme anpassen
  2. Visualisierung
  3. Trainieren Sie einen Roboter mit bekannten Daten, um das maximale Ergebnis zu zeigen

Unten im Video ist eine Demo des Arbeitstrainings von Robotern auf dem Client. Eines Tages werden sie anstelle von mir auch Sberbank-Futures handeln.

pskucherov
Rate author
Add a comment