ular-dqn sebagai jalan menuju ML

Программирование

Temukan di tensorflow-js apa yang Anda butuhkan untuk langkah pertama dalam ML dan trading.

Ini adalah pelatihan dqn di mana penghargaan dan hukuman diberikan kepada agen untuk tindakan.

https://github.com/tensorflow/tfjs-examples/tree/master/snake-dqn

https://storage.googleapis.com/tfjs-examples/snake-dqn/index.html

Ternyata kita memiliki seekor ular yang belajar dari pengalamannya sendiri untuk bergerak. Dia memiliki sejumlah gerakan (putar atau lanjutkan) dan tugasnya adalah untuk mendapatkan buah. Awalnya, ular itu tidak tahu caranya, tetapi selama pelatihan, ia memperoleh kemampuan untuk menemukan buah dan menghindar. Ini sangat mirip dengan perdagangan, bukan?

Yah, setidaknya untuk tugas kita, ketika kita menjalankan data, dan robot perlu membuat keputusan untuk membeli atau menjual.

Minus dari ular adalah bahwa itu ditulis untuk node.js, dan kita harus dapat melatih di browser (sehingga setiap pengguna dapat melakukannya). Oleh karena itu, hal yang sama harus dilakukan pada klien.

Saya menyeret ular itu ke halaman saya dengan bagan dan mencoba meluncurkannya. Itu tidak ada!

Ular itu melawan

paket dulu,

kemudian argumen. (omong-omong, saya juga membuat permintaan tarik di sebelah perbaikan https://github.com/tensorflow/tfjs-examples/pull/353),

lalu %% Unhandled Rejection (TypeError): Tidak dapat memanggil kelas sebagai fungsi%%. Yang sedang diperbaiki di sini https://github.com/tensorflow/tfjs/pull/3906/files, tetapi sejak Belum ada rilis, jadi saya harus menggantinya dengan tangan saya. Di sini, omong-omong, banyak orang memiliki masalah https://github.com/tensorflow/tfjs/issues/3384.

Anak di bawah umur sudah melangkah lebih jauh, seperti mengganti pekerjaan dari fs dengan indexeddb. Bekerja dengan yang saya memata-matai di sini, omong-omong. Nah, secara umum, cart-pole awalnya mengilhami saya untuk melakukan segala sesuatu pada klien.

https://github.com/tensorflow/tfjs-examples/tree/master/cart-pole

https://storage.googleapis.com/tfjs-examples/cart-pole/dist/index.html

pada akhirnya, inilah yang terjadi:

https://github.com/pskucherov/opexflow/pull/16/files

Sebenarnya, langkah selanjutnya adalah:

  1. Sesuai dengan grafik
  2. Visualisasi
  3. Latih robot pada data yang diketahui untuk menunjukkan hasil yang maksimal

Di bawah ini adalah video demo pelatihan kerja robot pada klien. Suatu hari mereka juga akan memperdagangkan berjangka Sberbank, bukan saya.

pskucherov
Rate author
Add a comment