snake-dqn нь ML-д хүрэх зам юм

Программирование

ML болон арилжааны эхний алхмуудад хэрэгтэй зүйлийг tensorflow-js-ээс олж болно.

Энэ бол төлөөлөгчийн үйлдэлд шагнал, торгууль өгдөг dqn сургалт юм.

https://github.com/tensorflow/tfjs-examples/tree/master/snake-dqn

https://storage.googleapis.com/tfjs-examples/snake-dqn/index.html

Бидэнд өөрийн туршлагаасаа хөдөлж сурдаг могой байгаа нь харагдаж байна. Тэр тодорхой тооны хөдөлгөөнтэй (эргэх эсвэл үргэлжлүүлэх) бөгөөд түүний даалгавар бол үр жимс рүү орох явдал юм. Могой эхэндээ яаж гэдгийг мэддэггүй ч сургалтын явцад жимс олж, бултах чадварыг олж авдаг. Энэ нь арилжаа наймаатай их төстэй, тийм үү?

Ядаж л бидний даалгаврын хувьд өгөгдөл ажиллаж байгаа үед робот худалдаж авах эсвэл зарах шийдвэр гаргах шаардлагатай болдог.

Могойн сул тал нь үүнийг node.js-д зориулж бичсэн байдаг бөгөөд бид хөтөч дээр сургах чадвартай байх хэрэгтэй (ямар ч хэрэглэгч үүнийг хийх боломжтой). Тиймээс үйлчлүүлэгчийн хувьд ижил зүйлийг хийх шаардлагатай байв.

Би могойг байгаагаар нь чирээд графиктай хуудас руугаа чирээд нээх гэж оролдов. Тэнд байгаагүй!

Могой дахин тулалдав

эхлээд багцууд,

дараа нь аргументууд. (Дашрамд хэлэхэд би https://github.com/tensorflow/tfjs-examples/pull/353 засварын хажууд татах хүсэлт тавьсан),

дараа нь %%Ашиглаагүй татгалзал (TypeError): Ангийг %% функцээр дуудаж болохгүй. Үүнийг https://github.com/tensorflow/tfjs/pull/3906/files энд засварлаж байгаа боловч үүнээс хойш Одоохондоо гаргаагүй байгаа тул гараараа орлуулах хэрэгтэй болсон. Энд, дашрамд хэлэхэд олон хүн https://github.com/tensorflow/tfjs/issues/3384 асуудалтай тулгардаг.

Насанд хүрээгүй хүмүүс fs-ийн ажлыг indexeddb-ээр солих гэх мэтээр аль хэдийнээ урагшилчихсан. Дашрамд хэлэхэд миний энд тагнаж байсан ажил. Ер нь тэргэнцэр нь надад үйлчлүүлэгчийн бүх зүйлийг хийх урам зориг өгсөн.

https://github.com/tensorflow/tfjs-examples/tree/master/cart-pole

https://storage.googleapis.com/tfjs-examples/cart-pole/dist/index.html

эцэст нь ийм зүйл болсон:

https://github.com/pskucherov/opexflow/pull/16/files

За, үнэндээ дараагийн алхам нь:

  1. Диаграммд тохирох
  2. Дүрслэл
  3. Хамгийн их үр дүнг харуулахын тулд роботыг мэдэгдэж буй өгөгдөл дээр сурга

Үйлчлүүлэгч дээр роботуудыг сургах ажлын видеог доор харуулав. Хэзээ нэгэн цагт тэд бас миний оронд Сбербанкны фьючерс арилжаалах болно.

pskucherov
Rate author
Add a comment