snake-dqn เป็นเส้นทางไปยังML

Программирование

พบใน tensorflow-js สิ่งที่คุณต้องการสำหรับขั้นตอนแรกใน ML และการซื้อขาย

นี่คือการฝึกอบรม dqn ที่มอบรางวัลและบทลงโทษให้กับตัวแทนสำหรับการกระทำ

https://github.com/tensorflow/tfjs-examples/tree/master/snake-dqn

https://storage.googleapis.com/tfjs-examples/snake-dqn/index.html

ปรากฎว่าเรามีงูที่เรียนรู้จากประสบการณ์ของตัวเองในการเคลื่อนไหว เธอมีการเคลื่อนไหวจำนวนหนึ่ง (เลี้ยวหรือดำเนินการต่อ) และงานของเธอคือการได้รับผลไม้ ในขั้นต้นงูไม่ทราบวิธี แต่ในระหว่างการฝึกฝนจะได้รับความสามารถในการหาผลไม้และหลบหลีก มันคล้ายกับการค้าขายมากใช่ไหม?

อย่างน้อยก็สำหรับงานของเรา เมื่อเรามีข้อมูลทำงาน และหุ่นยนต์จำเป็นต้องตัดสินใจซื้อหรือขาย

ข้อเสียของงูคือมันถูกเขียนขึ้นสำหรับ node.js และเราจำเป็นต้องสามารถฝึกในเบราว์เซอร์ได้ (เพื่อให้ผู้ใช้ทุกคนสามารถทำได้) ดังนั้นจึงต้องทำเช่นเดียวกันกับลูกค้า

ฉันลากงูตามที่ปรากฏบนหน้าของฉันพร้อมแผนภูมิและพยายามเปิดมัน มันไม่ได้อยู่ที่นั่น!

งูสู้กลับ

แพ็คเกจก่อน

แล้วอาร์กิวเมนต์ (อย่างไรก็ตาม ฉันยังทำการร้องขอการดึงถัดจากการแก้ไข https://github.com/tensorflow/tfjs-examples/pull/353)

จากนั้น %%Unhandled Rejection (TypeError): ไม่สามารถเรียกคลาสเป็นฟังก์ชัน%% ซึ่งกำลังได้รับการซ่อมแซมที่นี่ https://github.com/tensorflow/tfjs/pull/3906/files แต่เนื่องจาก ยังไม่มีการปลดปล่อยดังนั้นฉันต้องเปลี่ยนมันด้วยมือของฉัน อย่างไรก็ตาม หลายคนมีปัญหา https://github.com/tensorflow/tfjs/issues/3384

ผู้เยาว์ก้าวไปไกลกว่านั้นแล้ว เช่น การแทนที่งานจาก fs ด้วย indexeddb งานที่ฉันได้สอดแนมที่นี่โดยวิธีการ โดยทั่วไปแล้ว เสาเกวียนเป็นแรงบันดาลใจให้ฉันทำทุกอย่างกับลูกค้า

https://github.com/tensorflow/tfjs-examples/tree/master/cart-pole

https://storage.googleapis.com/tfjs-examples/cart-pole/dist/index.html

ในที่สุดนี่คือสิ่งที่เกิดขึ้น:

https://github.com/pskucherov/opexflow/pull/16/files

ที่จริงแล้วขั้นตอนต่อไปจะเป็น:

  1. พอดีกับชาร์ต
  2. การสร้างภาพ
  3. ฝึกหุ่นยนต์กับข้อมูลที่ทราบเพื่อแสดงผลสูงสุด

ด้านล่างนี้คือวิดีโอสาธิตการฝึกอบรมการทำงานของหุ่นยนต์ในไคลเอนต์ สักวันหนึ่งพวกเขาจะซื้อขายฟิวเจอร์ส Sberbank แทนฉัน

pskucherov
Rate author