ML மற்றும் டிரேடிங்கில் முதல் படிகளுக்கு தேவையானதை tensorflow-js இல் காணலாம்.
இது dqn பயிற்சியாகும், அங்கு செயல்களுக்காக முகவருக்கு வெகுமதிகளும் அபராதங்களும் வழங்கப்படும்.
https://github.com/tensorflow/tfjs-examples/tree/master/snake-dqn
https://storage.googleapis.com/tfjs-examples/snake-dqn/index.html
நகர்வதற்கு அதன் சொந்த அனுபவத்திலிருந்து கற்றுக் கொள்ளும் ஒரு பாம்பு நம்மிடம் உள்ளது. அவளுக்கு ஒரு குறிப்பிட்ட எண்ணிக்கையிலான நகர்வுகள் உள்ளன (திருப்பு அல்லது தொடரவும்) மற்றும் அவளுடைய பணி பழத்தைப் பெறுவதாகும். ஆரம்பத்தில், பாம்பு எப்படி என்று தெரியவில்லை, ஆனால் பயிற்சியின் போது, அது பழங்களைக் கண்டுபிடித்து ஏமாற்றும் திறனைப் பெறுகிறது. இது வர்த்தகத்திற்கு மிகவும் ஒத்திருக்கிறது, இல்லையா?
சரி, குறைந்தபட்சம் எங்கள் பணிக்காக, எங்களிடம் தரவு இயங்கும் போது, ரோபோ வாங்க அல்லது விற்க ஒரு முடிவை எடுக்க வேண்டும்.
பாம்பின் மைனஸ் என்னவென்றால், இது node.js க்காக எழுதப்பட்டுள்ளது, மேலும் நாம் உலாவியில் பயிற்சி பெற வேண்டும் (எந்தவொரு பயனரும் அதைச் செய்ய முடியும்). எனவே, வாடிக்கையாளருக்கும் இதைச் செய்ய வேண்டியிருந்தது.
நான் பாம்பை ஒரு விளக்கப்படத்துடன் என் பக்கத்திற்கு இழுத்து அதைத் தொடங்க முயற்சித்தேன். அது அங்கு இல்லை!
பாம்பு எதிர்த்துப் போராடியது
முதலில் தொகுப்புகள்,
பின்னர் வாதங்கள். (சரி, https://github.com/tensorflow/tfjs-examples/pull/353 திருத்தத்திற்கு அடுத்ததாக இழுக்கும் கோரிக்கையையும் செய்துள்ளேன்)
பின்னர் %% கையாளப்படாத நிராகரிப்பு (வகைப் பிழை): ஒரு வகுப்பை செயல்பாடு%% என அழைக்க முடியாது. இங்கே பழுதுபார்க்கப்படுகிறது https://github.com/tensorflow/tfjs/pull/3906/files, ஆனால் முதல் இன்னும் வெளியீடு இல்லை, எனவே நான் அதை என் கைகளால் மாற்ற வேண்டியிருந்தது. இங்கே, பலருக்கு https://github.com/tensorflow/tfjs/issues/3384 என்ற பிரச்சனை உள்ளது.
மைனர்கள் ஏற்கனவே மேலும் முன்னேறிவிட்டனர், அதாவது fs இன் வேலையை indexeddb உடன் மாற்றுவது போன்றது. நான் இங்கே உளவு பார்த்த வேலை. சரி, பொதுவாக, கார்ட்-துருவம் ஆரம்பத்தில் கிளையண்டில் எல்லாவற்றையும் செய்ய என்னை ஊக்கப்படுத்தியது.
https://github.com/tensorflow/tfjs-examples/tree/master/cart-pole
https://storage.googleapis.com/tfjs-examples/cart-pole/dist/index.html
இறுதியில், இதுதான் நடந்தது:
https://github.com/pskucherov/opexflow/pull/16/files
சரி, உண்மையில், அடுத்த படியாக இருக்கும்:
- விளக்கப்படங்களுக்கு பொருந்தும்
- காட்சிப்படுத்தல்
- அதிகபட்ச முடிவைக் காட்ட, அறியப்பட்ட தரவுகளில் ரோபோவைப் பயிற்றுவிக்கவும்
கிளையண்டில் ரோபோக்களின் வேலை-பயிற்சியின் வீடியோ டெமோ கீழே உள்ளது. என்றாவது ஒரு நாள் அவர்கள் எனக்குப் பதிலாக ஸ்பெர்பேங்க் எதிர்காலத்தையும் வர்த்தகம் செய்வார்கள்.