ML चा मार्ग म्हणून snake-dqn

Программирование

ML आणि ट्रेडिंग मधील पहिल्या चरणांसाठी तुम्हाला जे आवश्यक आहे ते टेन्सरफ्लो-js मध्ये आढळले.

हे dqn प्रशिक्षण आहे जेथे एजंटला कारवाईसाठी बक्षिसे आणि दंड दिला जातो.

https://github.com/tensorflow/tfjs-examples/tree/master/snake-dqn

https://storage.googleapis.com/tfjs-examples/snake-dqn/index.html

असे दिसून आले की आपल्याकडे एक साप आहे जो त्याच्या स्वत: च्या अनुभवातून हलण्यास शिकतो. तिच्याकडे विशिष्ट हालचाली आहेत (वळणे किंवा चालू ठेवणे) आणि तिचे कार्य फळ मिळवणे आहे. सुरुवातीला, सापाला कसे कळत नाही, परंतु प्रशिक्षणादरम्यान, तो फळे शोधण्याची आणि चकमा देण्याची क्षमता प्राप्त करतो. हे व्यापारासारखेच आहे, नाही का?

बरं, किमान आमच्या कार्यासाठी, जेव्हा आमच्याकडे डेटा चालू असतो आणि रोबोटला खरेदी किंवा विक्री करण्याचा निर्णय घेण्याची आवश्यकता असते.

सापाचे वजा हे आहे की ते node.js साठी लिहिलेले आहे, आणि आम्हाला ब्राउझरमध्ये प्रशिक्षण देण्यास सक्षम असणे आवश्यक आहे (जेणेकरून कोणताही वापरकर्ता ते करू शकेल). त्यामुळे क्लायंटवरही असेच करावे लागले.

साप जसा आहे तसा मी एका तक्त्यासह माझ्या पृष्ठावर ओढला आणि लाँच करण्याचा प्रयत्न केला. ते तिथे नव्हते!

साप परत लढला

प्रथम पॅकेजेस,

मग युक्तिवाद. (तसे, मी फिक्स https://github.com/tensorflow/tfjs-examples/pull/353 च्या पुढे एक पुल विनंती देखील केली आहे),

नंतर %% अनहँडल्ड रिजेक्शन (TypeError): क्लासला फंक्शन%% म्हणून कॉल करू शकत नाही. ज्याची येथे दुरुस्ती केली जात आहे https://github.com/tensorflow/tfjs/pull/3906/files, परंतु तेव्हापासून अजून रिलीझ नाही, म्हणून मला ते माझ्या हातांनी बदलावे लागले. येथे, तसे, बर्‍याच लोकांना https://github.com/tensorflow/tfjs/issues/3384 समस्या आहे.

अल्पवयीन आधीच पुढे गेले आहेत, जसे की fs चे काम indexeddb ने बदलणे. मी येथे हेरगिरी ज्या कामासह, तसे. विहीर, सर्वसाधारणपणे, कार्ट-पोलने सुरुवातीला मला क्लायंटवर सर्वकाही करण्यास प्रेरित केले.

https://github.com/tensorflow/tfjs-examples/tree/master/cart-pole

https://storage.googleapis.com/tfjs-examples/cart-pole/dist/index.html

शेवटी, हे घडले:

https://github.com/pskucherov/opexflow/pull/16/files

बरं, खरं तर, पुढील पायरी असेल:

  1. चार्टमध्ये फिट
  2. व्हिज्युअलायझेशन
  3. जास्तीत जास्त परिणाम दर्शविण्यासाठी ज्ञात डेटावर रोबोटला प्रशिक्षण द्या

खाली क्लायंटवरील रोबोट्सच्या कार्य-प्रशिक्षणाचा व्हिडिओ डेमो आहे. एखाद्या दिवशी ते माझ्याऐवजी Sberbank फ्युचर्सचा व्यापार करतील.

pskucherov
Rate author
Add a comment