MLக்கான பாதை பாம்பு-dqn

Программирование

ML மற்றும் டிரேடிங்கில் முதல் படிகளுக்கு தேவையானதை tensorflow-js இல் காணலாம்.

இது dqn பயிற்சியாகும், அங்கு செயல்களுக்காக முகவருக்கு வெகுமதிகளும் அபராதங்களும் வழங்கப்படும்.

https://github.com/tensorflow/tfjs-examples/tree/master/snake-dqn

https://storage.googleapis.com/tfjs-examples/snake-dqn/index.html

நகர்வதற்கு அதன் சொந்த அனுபவத்திலிருந்து கற்றுக் கொள்ளும் ஒரு பாம்பு நம்மிடம் உள்ளது. அவளுக்கு ஒரு குறிப்பிட்ட எண்ணிக்கையிலான நகர்வுகள் உள்ளன (திருப்பு அல்லது தொடரவும்) மற்றும் அவளுடைய பணி பழத்தைப் பெறுவதாகும். ஆரம்பத்தில், பாம்பு எப்படி என்று தெரியவில்லை, ஆனால் பயிற்சியின் போது, ​​அது பழங்களைக் கண்டுபிடித்து ஏமாற்றும் திறனைப் பெறுகிறது. இது வர்த்தகத்திற்கு மிகவும் ஒத்திருக்கிறது, இல்லையா?

சரி, குறைந்தபட்சம் எங்கள் பணிக்காக, எங்களிடம் தரவு இயங்கும் போது, ​​ரோபோ வாங்க அல்லது விற்க ஒரு முடிவை எடுக்க வேண்டும்.

பாம்பின் மைனஸ் என்னவென்றால், இது node.js க்காக எழுதப்பட்டுள்ளது, மேலும் நாம் உலாவியில் பயிற்சி பெற வேண்டும் (எந்தவொரு பயனரும் அதைச் செய்ய முடியும்). எனவே, வாடிக்கையாளருக்கும் இதைச் செய்ய வேண்டியிருந்தது.

நான் பாம்பை ஒரு விளக்கப்படத்துடன் என் பக்கத்திற்கு இழுத்து அதைத் தொடங்க முயற்சித்தேன். அது அங்கு இல்லை!

பாம்பு எதிர்த்துப் போராடியது

முதலில் தொகுப்புகள்,

பின்னர் வாதங்கள். (சரி, https://github.com/tensorflow/tfjs-examples/pull/353 திருத்தத்திற்கு அடுத்ததாக இழுக்கும் கோரிக்கையையும் செய்துள்ளேன்)

பின்னர் %% கையாளப்படாத நிராகரிப்பு (வகைப் பிழை): ஒரு வகுப்பை செயல்பாடு%% என அழைக்க முடியாது. இங்கே பழுதுபார்க்கப்படுகிறது https://github.com/tensorflow/tfjs/pull/3906/files, ஆனால் முதல் இன்னும் வெளியீடு இல்லை, எனவே நான் அதை என் கைகளால் மாற்ற வேண்டியிருந்தது. இங்கே, பலருக்கு https://github.com/tensorflow/tfjs/issues/3384 என்ற பிரச்சனை உள்ளது.

மைனர்கள் ஏற்கனவே மேலும் முன்னேறிவிட்டனர், அதாவது fs இன் வேலையை indexeddb உடன் மாற்றுவது போன்றது. நான் இங்கே உளவு பார்த்த வேலை. சரி, பொதுவாக, கார்ட்-துருவம் ஆரம்பத்தில் கிளையண்டில் எல்லாவற்றையும் செய்ய என்னை ஊக்கப்படுத்தியது.

https://github.com/tensorflow/tfjs-examples/tree/master/cart-pole

https://storage.googleapis.com/tfjs-examples/cart-pole/dist/index.html

இறுதியில், இதுதான் நடந்தது:

https://github.com/pskucherov/opexflow/pull/16/files

சரி, உண்மையில், அடுத்த படியாக இருக்கும்:

  1. விளக்கப்படங்களுக்கு பொருந்தும்
  2. காட்சிப்படுத்தல்
  3. அதிகபட்ச முடிவைக் காட்ட, அறியப்பட்ட தரவுகளில் ரோபோவைப் பயிற்றுவிக்கவும்

கிளையண்டில் ரோபோக்களின் வேலை-பயிற்சியின் வீடியோ டெமோ கீழே உள்ளது. என்றாவது ஒரு நாள் அவர்கள் எனக்குப் பதிலாக ஸ்பெர்பேங்க் எதிர்காலத்தையும் வர்த்தகம் செய்வார்கள்.

pskucherov
Rate author
Add a comment