snake-dqn ML کے راستے کے طور پر

Программирование

tensorflow-js میں پایا جاتا ہے جو آپ کو ML اور ٹریڈنگ کے پہلے مراحل کے لیے درکار ہے۔

یہ dqn ٹریننگ ہے جہاں ایجنٹ کو اعمال کے بدلے انعامات اور جرمانے دیئے جاتے ہیں۔

https://github.com/tensorflow/tfjs-examples/tree/master/snake-dqn

https://storage.googleapis.com/tfjs-examples/snake-dqn/index.html

یہ پتہ چلتا ہے کہ ہمارے پاس ایک سانپ ہے جو حرکت کرنا اپنے تجربے سے سیکھتا ہے۔ اس کے پاس ایک خاص تعداد میں چالیں ہیں (مڑنا یا جاری رکھنا) اور اس کا کام پھل تک پہنچنا ہے۔ شروع میں سانپ کو یہ نہیں معلوم ہوتا کہ کیسے، لیکن تربیت کے دوران وہ پھل تلاش کرنے اور چکما دینے کی صلاحیت حاصل کر لیتا ہے۔ یہ تجارت سے بہت ملتا جلتا ہے، ہے نا؟

ٹھیک ہے، کم از کم ہمارے کام کے لیے، جب ہمارے پاس ڈیٹا چل رہا ہے، اور روبوٹ کو خریدنے یا بیچنے کا فیصلہ کرنے کی ضرورت ہے۔

سانپ کا مائنس یہ ہے کہ یہ node.js کے لئے لکھا گیا ہے، اور ہمیں براؤزر میں تربیت دینے کے قابل ہونے کی ضرورت ہے (تاکہ کوئی بھی صارف یہ کر سکے)۔ اس لیے کلائنٹ پر بھی ایسا ہی کرنا پڑا۔

میں نے سانپ کو اپنے صفحہ پر ایک چارٹ کے ساتھ گھسیٹ لیا اور اسے لانچ کرنے کی کوشش کی۔ یہ وہاں نہیں تھا!

سانپ نے جوابی وار کیا۔

پہلے پیکجز،

پھر دلائل. (ویسے، میں نے فکس https://github.com/tensorflow/tfjs-examples/pull/353 کے آگے پل کی درخواست بھی کی تھی)

پھر %% Unhandled Rejection (TypeError): کسی کلاس کو بطور فنکشن کال نہیں کیا جا سکتا۔ جس کی یہاں مرمت کی جارہی ہے https://github.com/tensorflow/tfjs/pull/3906/files، لیکن جب سے ابھی تک کوئی ریلیز نہیں ہوئی ہے، اس لیے مجھے اسے اپنے ہاتھوں سے بدلنا پڑا۔ یہاں، ویسے، بہت سے لوگوں کو https://github.com/tensorflow/tfjs/issues/3384 ایک مسئلہ ہے۔

نابالغ پہلے ہی آگے بڑھ چکے ہیں، جیسے fs سے کام کو indexeddb سے تبدیل کرنا۔ ویسے کام جس کے ساتھ میں نے یہاں جاسوسی کی۔ ٹھیک ہے، عام طور پر، کارٹ پول نے ابتدائی طور پر مجھے کلائنٹ پر سب کچھ کرنے کی ترغیب دی۔

https://github.com/tensorflow/tfjs-examples/tree/master/cart-pole

https://storage.googleapis.com/tfjs-examples/cart-pole/dist/index.html

آخر میں، یہ کیا ہوا ہے:

https://github.com/pskucherov/opexflow/pull/16/files

ٹھیک ہے، اصل میں، اگلا مرحلہ یہ ہوگا:

  1. چارٹ کے مطابق
  2. تصور
  3. زیادہ سے زیادہ نتیجہ دکھانے کے لیے معلوم ڈیٹا پر روبوٹ کو تربیت دیں۔

ذیل میں کلائنٹ پر روبوٹس کی ورک ٹریننگ کا ایک ویڈیو ڈیمو ہے۔ کسی دن وہ میری بجائے سبربینک فیوچر کی تجارت بھی کریں گے۔

pskucherov
Rate author
Add a comment