snake-dqn като път към ML

Программирование

Намерено в tensorflow-js това, от което се нуждаете за първите стъпки в ML и търговията.

Това е dqn обучение, при което се дават награди и наказания на агента за действия.

https://github.com/tensorflow/tfjs-examples/tree/master/snake-dqn

https://storage.googleapis.com/tfjs-examples/snake-dqn/index.html

Оказва се, че имаме змия, която се учи от собствения си опит да се движи. Тя има определен брой ходове (завъртете или продължете) и нейната задача е да стигне до плода. Първоначално змията не знае как, но в хода на обучението придобива способността да намира плодове и да избягва. Това е много подобно на търговията, нали?

Е, поне за нашата задача, когато имаме работещи данни и роботът трябва да вземе решение за покупка или продажба.

Минусът на змията е, че е написана за node.js и трябва да можем да тренираме в браузъра (така че всеки потребител да може да го направи). Следователно същото трябваше да се направи и на клиента.

Преместих змията такава, каквато е, на моята страница с диаграма и се опитах да я стартирам. Нямаше го!

Змията отвърна на удара

първо пакети,

след това аргументи. (между другото, направих и заявка за изтегляне до корекцията https://github.com/tensorflow/tfjs-examples/pull/353),

след това %%Необработено отхвърляне (TypeError): Не може да се извика клас като функция%%. Което се поправя тук https://github.com/tensorflow/tfjs/pull/3906/files, но тъй като Все още няма освобождаване, така че трябваше да го заменя с ръцете си. Тук, между другото, много хора имат проблем https://github.com/tensorflow/tfjs/issues/3384.

Малките вече са отишли ​​по-далеч, като замяната на работа от fs с indexeddb. Работа, с която шпионирах тук, между другото. Е, като цяло, каруцата първоначално ме вдъхнови да направя всичко на клиента.

https://github.com/tensorflow/tfjs-examples/tree/master/cart-pole

https://storage.googleapis.com/tfjs-examples/cart-pole/dist/index.html

накрая се получи ето какво:

https://github.com/pskucherov/opexflow/pull/16/files

Е, всъщност следващата стъпка ще бъде:

  1. Побира се в диаграми
  2. Визуализация
  3. Обучете робота на известни данни, за да покаже максимален резултат

По-долу има видео демонстрация на обучението на роботи на клиента. Някой ден те също ще търгуват фючърси на Сбербанк вместо мен.

pskucherov
Rate author
Add a comment