solid-dqn dưới dạng đường dẫn đến ML

Программирование

Tìm thấy trong tensorflow-js những gì bạn cần cho những bước đầu tiên trong ML và giao dịch.

Đây là khóa đào tạo dqn, nơi đại lý được trao phần thưởng và hình phạt cho các hành động.

https://github.com/tensorflow/tfjs-examples/tree/master/snake-dqn

https://storage.googleapis.com/tfjs-examples/snake-dqn/index.html

Hóa ra chúng ta có một con rắn học từ kinh nghiệm của chính nó để di chuyển. Cô ấy có một số bước di chuyển nhất định (rẽ hoặc tiếp tục) và nhiệm vụ của cô ấy là đi đến trái cây. Ban đầu, con rắn không biết làm bất cứ điều gì, nhưng trong quá trình huấn luyện, nó có khả năng tìm trái cây và né tránh. Rất giống với giao dịch, phải không?

Chà, ít nhất là đối với nhiệm vụ của chúng tôi, khi chúng tôi có dữ liệu đang chạy và rô-bốt cần đưa ra quyết định mua hoặc bán.

Nhược điểm của con rắn là nó được viết cho node.js và chúng ta cần có khả năng đào tạo trong trình duyệt (để bất kỳ người dùng nào cũng có thể làm được). Do đó, nó là cần thiết để bắt đầu tương tự trên máy khách.

Tôi đã đưa con rắn vào trang của mình với biểu đồ và cố gắng bắt đầu nó. Nó không phải như vậy!

Con rắn đã chống lại mọi cách có thể,

gói đầu tiên,

sau đó là các đối số. (Nhân tiện, tôi cũng đã thực hiện một yêu cầu kéo bên cạnh bản sửa lỗi https://github.com/tensorflow/tfjs-examples/pull/353),

then %% Unhandled Rejection (TypeError): Không thể gọi một lớp dưới dạng hàm %%. Đã được sửa chữa tại đây https://github.com/tensorflow/tfjs/pull/3906/files, nhưng kể từ khi không có bản phát hành nào được nêu ra, sau đó tôi đã phải thay thế đôi tay của mình. Nhân tiện, nhiều người gặp sự cố https://github.com/tensorflow/tfjs/issues/3384.

Sau đó, có những trẻ vị thành niên, như thay thế fs cho indexeddb. Nhân tiện, công việc mà tôi đã theo dõi ở đây. Nói chung, lúc đầu, cart-pole lấy cảm hứng làm mọi thứ cho khách hàng.

https://github.com/tensorflow/tfjs-examples/tree/master/cart-pole

https://storage.googleapis.com/tfjs-examples/cart-pole/dist/index.html

cuối cùng, đây là những gì đã xảy ra:

https://github.com/pskucherov/opexflow/pull/16/files

Chà, vậy thôi, giai đoạn tiếp theo sẽ là:

  1. Phù hợp với biểu đồ
  2. Hình dung
  3. Huấn luyện rô bốt trên dữ liệu đã biết để hiển thị kết quả tối đa

Dưới đây trong video là bản demo về quá trình đào tạo robot trên máy khách. Một ngày nào đó họ cũng sẽ giao dịch hợp đồng tương lai Sberbank thay vì tôi.

pskucherov
Rate author
Add a comment