snake-dqn sebagai laluan ke ML

Программирование

Ditemui dalam tensorflow-js perkara yang anda perlukan untuk langkah pertama dalam ML dan perdagangan.

Ini adalah latihan dqn di mana ganjaran dan penalti diberikan kepada ejen untuk tindakan.

https://github.com/tensorflow/tfjs-examples/tree/master/snake-dqn

https://storage.googleapis.com/tfjs-examples/snake-dqn/index.html

Ternyata kita mempunyai seekor ular yang belajar dari pengalamannya sendiri untuk bergerak. Dia mempunyai bilangan pergerakan tertentu (berpusing atau teruskan) dan tugasnya adalah untuk mendapatkan buah. Pada mulanya, ular itu tidak tahu bagaimana, tetapi semasa latihan, ia mendapat keupayaan untuk mencari buah-buahan dan mengelak. Ia sangat serupa dengan perdagangan, bukan?

Nah, sekurang-kurangnya untuk tugas kita, apabila kita mempunyai data berjalan, dan robot perlu membuat keputusan untuk membeli atau menjual.

Kekurangan ular ialah ia ditulis untuk node.js, dan kita perlu dapat melatih dalam penyemak imbas (supaya mana-mana pengguna boleh melakukannya). Oleh itu, perkara yang sama terpaksa dilakukan ke atas pelanggan.

Saya menyeret ular itu ke halaman saya dengan carta dan cuba melancarkannya. Ia tidak ada!

Ular itu melawan balik

pakej dahulu,

kemudian hujah. (dengan cara ini, saya juga membuat permintaan tarik di sebelah pembetulan https://github.com/tensorflow/tfjs-examples/pull/353),

kemudian %%Penolakan Tidak Terkendali (TypeError): Tidak boleh memanggil kelas sebagai fungsi%%. Yang sedang dibaiki di sini https://github.com/tensorflow/tfjs/pull/3906/files, tetapi sejak Belum ada keluaran, jadi saya terpaksa menggantikannya dengan tangan saya. Di sini, omong-omong, ramai orang mempunyai masalah https://github.com/tensorflow/tfjs/issues/3384.

Kanak-kanak di bawah umur telah pergi lebih jauh, seperti menggantikan kerja dari fs dengan indexeddb. Kerja yang saya lihat di sini, dengan cara itu. Secara amnya, tiang kereta pada mulanya memberi inspirasi kepada saya untuk melakukan segala-galanya pada pelanggan.

https://github.com/tensorflow/tfjs-examples/tree/master/cart-pole

https://storage.googleapis.com/tfjs-examples/cart-pole/dist/index.html

akhirnya, inilah yang berlaku:

https://github.com/pskucherov/opexflow/pull/16/files

Sebenarnya, langkah seterusnya ialah:

  1. Sesuai dengan carta
  2. Visualisasi
  3. Latih robot pada data yang diketahui untuk menunjukkan hasil maksimum

Di bawah ialah demo video latihan kerja robot pada pelanggan. Suatu hari nanti mereka juga akan berdagang niaga hadapan Sberbank dan bukannya saya.

pskucherov
Rate author
Add a comment