MLへのパスとしてのsnake-dqn

Программирование

Tensorflow-jsで、MLと取引の最初のステップに必要なものが見つかりました。

これはdqnトレーニングであり、エージェントにはアクションに対する報酬とペナルティが与えられます。

https://github.com/tensorflow/tfjs-examples/tree/master/snake-dqn

https://storage.googleapis.com/tfjs-examples/snake-dqn/index.html

自分の経験から動くことを学ぶヘビがいることがわかりました。彼女には一定数の動き(方向転換または継続)があり、彼女の仕事は実を結ぶことです。当初、ヘビは何もする方法を知りませんが、訓練の過程で、果物を見つけてかわす能力を獲得します。取引と非常に似ていますね。

少なくとも私たちのタスクでは、データが実行されていて、ロボットが購入または販売を決定する必要がある場合です。

ヘビの欠点は、node.js用に作成されていることです。また、ブラウザーでトレーニングできる必要があります(すべてのユーザーがトレーニングできるようにするため)。したがって、クライアントで同じことを開始する必要がありました。

ヘビをそのままグラフ付きのページに持っていき、始めてみました。そうではありませんでした!

ヘビはあらゆる方法で抵抗しました、

最初にパッケージ、

その後、引数。(ちなみに、修正の横にプルリクエストを作成しましたhttps://github.com/tensorflow/tfjs-examples/pull/353)、

次に%%未処理の拒否(TypeError):クラスを関数%%として呼び出すことはできません。https://github.com/tensorflow/tfjs/pull/3906/filesで修復されていますが、まだリリースがないので、手を代用しなければなりませんでした。ここでは、ちなみに、多くの人が問題を抱えていますhttps://github.com/tensorflow/tfjs/issues/3384。

次に、indexeddbの代わりにfsを使用するなど、未成年者がいました。ちなみに、ここでスパイした作品。さて、一般的に、カートポールは当初、クライアントですべてを行うように促されました。

https://github.com/tensorflow/tfjs-examples/tree/master/cart-pole

https://storage.googleapis.com/tfjs-examples/cart-pole/dist/index.html

結局、これが起こったことです:

https://github.com/pskucherov/opexflow/pull/16/files

さて、それがすべてです、次の段階は次のようになります:

  1. チャートに合わせる
  2. 視覚化
  3. 最大の結果を示すために、既知のデータでロボットをトレーニングします

以下のビデオは、クライアントでのロボットの作業トレーニングのデモです。いつか彼らは私の代わりにズベルバンク先物も取引するでしょう。

pskucherov
Rate author