நரம்பியல் நெட்வொர்க் YaLM 100B நடைமுறையில் உள்ளது. - Программирование, инвестиции и алготрейдинг

ஜூன் மாத இறுதியில், யாண்டெக்ஸ்
100 பில்லியன் அளவுருக்கள் கொண்ட நரம்பியல் வலையமைப்பை YaLM 100B என்று பொதுமக்களுக்கு வெளியிட்டது . இது பொது களத்தில் உள்ள மிகப்பெரிய GPT போன்ற நரம்பியல் நெட்வொர்க் ஆகும். அவர்கள் எவ்வாறு கற்பித்தார்கள், சிறந்த எடுத்துக்காட்டுகளைக் காட்டினார்கள் மற்றும் நியூரானின் திறன் என்ன என்பதைப் பற்றி இது கூறுகிறது. ஆனால் இது நடைமுறையில் மிகவும் நல்லதா மற்றும் வீட்டில் பொருந்துமா? கட்டுரை இதைப் பற்றி அமைதியாக உள்ளது, மேலும், சுமார் 200 ஜிபி ஜிபியு ரேம் தேவைப்படுவதால், அதை இயக்கி சரிபார்ப்பது அவ்வளவு எளிதானது அல்ல. ஹப்ரே பற்றிய
இந்தக் கருத்து நிலைமையை மிகத் துல்லியமாக வெளிப்படுத்துகிறது
.

Yandex இல், அத்தகைய புத்திசாலிகள் அனைவரும், அவர்கள் ஒரு சாதாரண எப்படி-என்று கூட இடுகையிடவில்லை என்று கூறப்படுகிறது. பெரிய மாடலுக்கு api கிடையாது, சாதாரண மக்களுக்கு (Google Colabல்) ரெடிமேட் ஸ்டிரிப்ட் டவுன் மீடியம் அல்லது ஸ்மால் மாடல் கிடையாது. மாதிரியை எவ்வாறு அமைப்பது, உரையை எவ்வாறு உருவாக்குவது என்பதற்கான எடுத்துக்காட்டு எதுவும் கொடுக்கப்படவில்லை. மேதாவிகளுக்கான ஓரிரு நுணுக்கங்களை கட்டுரை குறிப்பிடுகிறது அவ்வளவுதான். “சி” என்ற எழுத்தில் வங்கி எப்படி செய்தது என்பதை கூர்ந்து கவனித்து அதையே செய்தால் போதும். இந்த மாதிரியானது தோல்வியுற்ற சோதனைகளில் ஒன்றாகும் என்ற எண்ணம் எனக்கு வந்தது, இது குப்பையில் போடுவதற்கு பரிதாபமாக இருந்தது, எனவே யாண்டெக்ஸ் என்ன சிறந்த மாதிரிகளை உருவாக்குகிறது என்பதைக் காட்ட இது திறந்த மூலத்தில் வெளியிடப்பட்டது, மேலும் இது திறந்த மூலமாகும்!

இணையத்தில் யாழ் ஓட்டுவது அல்லது ஆன்லைனில் முயற்சி செய்வது எப்படி என்று பல கேள்விகள் உள்ளன, ஆனால் இதற்கான பதில்கள் இல்லை. இந்தக் கேள்விகளைக் கேட்ட பயனர்களில் நானும் ஒருவன். மற்றும் அதை கண்டறிவதில் அமைக்கவும். நிதி ரோபோக்களுக்கான உரைகளை உருவாக்க எனக்கு ஒரு வழி தேவைப்பட்டதால். அதனால் அவர்கள் மதிப்புகளை மட்டும் கணிக்க முடியாது, ஆனால் நிதி அறிக்கைகளின் அடிப்படையில் உரையில் கருத்து தெரிவிக்கலாம். சாராம்சத்தில், நிதி ஆய்வாளர்கள் என்ன செய்கிறார்களோ, அது செயற்கை நுண்ணறிவைப் பயன்படுத்தினால் மட்டுமே இருக்கும். யாழ் ஓட்ட இரண்டு வழிகள் உள்ளன.
கிளவுட்டில் ஒரு சேவையகத்தை வாடகைக்கு விடுங்கள்200+ ஜிபி ஜிபியு ரேம் அல்லது குறியீட்டை மாற்றியமைத்து, டீப்ஸ்பீட் ஜீரோ ஆஃப்லோடுடன் இயக்கவும் (ஜிபியு நரம்பியல் நெட்வொர்க்கின் ஒரு பகுதியை தொடர்ச்சியாக செயலாக்கும் போது, மீதமுள்ளவை CPU RAM அல்லது NVMe இல் சேமிக்கப்படும்). முதல் மிகவும் விலை உயர்ந்தது, ஒரு மணி நேரத்திற்கு சுமார் 2500 ரூபிள் அல்லது மாதத்திற்கு 1.7 மில்லியன். இரண்டாவது தெரியவில்லை, ஏனெனில் களஞ்சியத்தில் உள்ள குறியீடு வழங்கப்படவில்லை,
களஞ்சியத்தின் சிக்கலில் குறிப்புகள் மட்டுமே உள்ளன, அதைச் செய்வது கடினம் அல்ல. எளிமையாக ஆரம்பிக்கலாம்.

Contents

YaLM 100B வெளியீட்டு வழிமுறைகள்
1. நாங்கள் 200 ஜிபி ஜிபியு ரேம் வாடகைக்கு விடுகிறோம், உதாரணமாக இங்கே .
2. YaLM உடன் களஞ்சியத்தை குளோன் செய்யவும்
3. சோதனைச் சாவடிகளைப் பதிவிறக்கவும் (அடிப்படை மாதிரி பயிற்சித் தகவல்)
4. என்விடியா – டாக்கர்2 ஐ நிறுவவும்
5. YaLM க்கான கொள்கலனை உருவாக்குதல்
6. உள்ளடக்கத்தை தயார் செய்யவும்
6.1 சோதனைச் சாவடிகள்
6.2 வீடியோ அட்டைகள்
7. டாக்கர் கொள்கலனை இயக்கவும்
8. YaLM 100B இலிருந்து உதாரணத்தை இயக்கவும்
9. வேலையின் முடிவுகள்
200Gb GPU RAM இல்லாமல் YaLM ஐ இயக்குவது எப்படி?
சுருக்கமாகக்

YaLM 100B வெளியீட்டு வழிமுறைகள்

1. நாங்கள் 200 ஜிபி ஜிபியு ரேம் வாடகைக்கு விடுகிறோம், உதாரணமாக இங்கே .

நரம்பியல் நெட்வொர்க் YaLM 100B நடைமுறையில் உள்ளது.

உங்களுக்கு குறைந்தபட்சம் 200 ஜிபி மொத்த வீடியோ நினைவகம் தேவை. 8×40 = 320 ஜிபி. இது மட்டுமே பொருந்தும். 200 க்கும் குறைவாக சாத்தியமற்றது, மேலும் சாத்தியம். அம்புக்குறி CPU RAM ஐக் குறிக்கிறது, நாங்கள் அதைப் பார்க்கவில்லை. அவள் யாராக வேண்டுமானாலும் இருக்கலாம்.

சுமார் 300 ஜிபி வட்டை நாங்கள் குறிப்பிடுகிறோம், எனவே உதிரி மற்றும் முன்னுரிமை வேகமான வட்டு, ஏனெனில். பல்லாயிரக்கணக்கான ஜிகாபைட் தரவுகள் அதற்கு மாற்றப்படும்.

ஆதாரங்களில் உருவாக்கும்போது, உபுண்டு எம்எல் (இயந்திர கற்றல்) என்பதைத் தேர்ந்தெடுக்கவும். வீடியோ அட்டைகள் கட்டமைக்கப்படுவதற்கு இது கட்டாயமாகும், மேலும் எதுவும் நிறுவப்பட வேண்டியதில்லை.

ஒரு சேவையகத்தை உருவாக்கும் போது, ஒதுக்கீடுகளுடன் நுணுக்கங்கள் உள்ளன, உபகரணங்கள் கிடைக்கவில்லை என்ற உணர்வை நீங்கள் பெறலாம், ஆனால் உண்மையில் நீங்கள் அமைப்புகளில் ஒதுக்கீட்டை அதிகரிக்க வேண்டும். சேவையகம் செயல்படுத்தப்பட்ட பிறகு (இது 5-10 நிமிடங்கள் ஆகலாம்), சேவையகத்துடன் ssh வழியாக அல்லது நேரடியாக சர்வர் பக்கத்தில் உள்ள வலை கன்சோலில் இணைத்து கட்டளையை இயக்கவும்.

என்விடியா-ஸ்மி

இதன் விளைவாக வீடியோ அட்டைகள், இயக்கி பதிப்பு மற்றும் குடா கொண்ட அட்டவணை இருக்க வேண்டும். தோராயமாக இப்படி.
நரம்பியல் நெட்வொர்க் YaLM 100B நடைமுறையில் உள்ளது. இயக்கி பதிப்பு தலைப்பு மற்றும் எங்கே. இடது பக்கத்தில் சாதன எண்கள் உள்ளன, மையத்தில் சாதன நினைவகத்தின் அளவு உள்ளது. உங்களிடம் இந்த தகவல் இல்லையென்றால், நீங்கள் தவறான மூலத்திலிருந்து சேவையகத்தை சேகரித்துள்ளீர்கள். மேலே விவரிக்கப்பட்டுள்ளபடி உபுண்டு எம்எல் (மெஷின் லேர்னாங்) தேவை.

2. YaLM உடன் களஞ்சியத்தை குளோன் செய்யவும்

சூடோ கிட் குளோன் https://github.com/yandex/YaLM-100B/ யால்ம்
சிடி யால்ம்

உங்கள் முகப்பு கோப்புறையை குளோன் செய்யுங்கள், அதன் பிறகு நீங்கள் டோக்கர் கட்டமைப்பைத் திருத்த வேண்டியதில்லை. வேறு எங்காவது குளோன் செய்யப்பட்டிருந்தால்,
இங்கே சென்று குளோன் செய்யப்பட்ட இடத்திற்கு பாதையைச் சேர்க்கவும்.

3. சோதனைச் சாவடிகளைப் பதிவிறக்கவும் (அடிப்படை மாதிரி பயிற்சித் தகவல்)

sudo chmod +x ./download/download.sh
sudo bash ./download/download.sh

இதற்கு ஒரு மணி நேரம் ஆகும். வீணாக நேரத்தை வீணாக்காமல் இருக்க, நாங்கள் ஒரு புதிய ssh இணைப்பை உருவாக்குகிறோம் மற்றும் இணையாக ஒரு டாக்கர் கொள்கலனை உருவாக்கத் தொடங்குகிறோம்.

4. என்விடியா – டாக்கர் 2 ஐ நிறுவவும்

சாதாரண டாக்கர் பொருத்தமானது அல்ல,
nvidia-docker2 தேவை .
https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/install-guide.html#setting-up-nvidia-container-toolkit

5. YaLM க்கான கொள்கலனை உருவாக்குதல்

cd yalm
sudo chmod +x ./docker/*
sudo bash ./docker/build.sh

அதுவும் ஒரு மணி நேரம் ஆகும்.

வாழ்க்கை ஊடுருவல். நீங்கள் சோதனைச் சாவடிகளைப் பதிவிறக்கலாம், டோக்கரை நிறுவலாம் மற்றும் ஒரு வீடியோ அட்டை மூலம் மலிவான சேவையகத்தில் கொள்கலனை உருவாக்கலாம். இது காலப்போக்கில் ஒரே மாதிரியாக இருக்கும், எனவே நீங்கள் சிறிது சேமிக்கலாம். மலிவான சேவையகத்தில் அசெம்பிளி செய்த பிறகு, அதை நீக்கி, மலிவான சேவையகத்திலிருந்து ஒரு வட்டைப் பயன்படுத்தி போர் சேவையகத்தை உருவாக்குகிறோம். சட்டசபைக்காக காத்திருப்பதற்கும் சோதனைச் சாவடிகளை வெளியேற்றுவதற்கும் நீங்கள் அதிக நேரம் செலுத்த மாட்டீர்கள்.

6. உள்ளடக்கத்தை தயார் செய்யவும்

6.1 சோதனைச் சாவடிகள்

சோதனைச் சாவடிகளின் பதிவிறக்கம் முடிந்ததும், நீங்கள் அவற்றை கட்டமைப்புகளுக்குள் நழுவ வேண்டும். இரண்டு வழிகள் உள்ளன, சரியான அளவுருக்கள் அல்லது பரிமாற்ற சோதனைச் சாவடிகள். எல்லா இடங்களிலும் சோதனைச் சாவடிகள் திட்டத்தின் முக்கிய கோப்பகத்தில் இருக்கும் என்று எதிர்பார்க்கப்படுகிறது, பதிவிறக்கம் செய்யப்பட்டவை மேலே உள்ள பதிவிறக்க கோப்புறையிலிருந்து மாற்றப்பட வேண்டும். yalm கோப்புறை இயக்கத்தில் இருப்பது

mv ./download/yalm100b_checkpoint ./

அல்லது எடுத்துக்காட்டுக் கோப்புகளில் உள்ள கோப்புகளுக்கான பாதைகளை
மாற்றவும்

6.2 வீடியோ அட்டைகள்

வீடியோ அட்டைகள் சரியாக அமைக்கப்பட்டுள்ளதா என்பதை நாங்கள் சரிபார்க்கிறோம். உங்களிடம் எட்டு வீடியோ அட்டைகள் இருந்தால், எதையும் மாற்ற வேண்டியதில்லை. எண் வேறுபட்டால், இந்த வரிகளை
இரண்டாவது வரியில், பயன்படுத்தப்படும் சாதனங்களின் எண்களை மாற்றுவோம் (நீங்கள் ஏற்கனவே தொடங்கியுள்ள nvidia-smi இல் அவற்றைப் பார்க்கலாம்). நான்காவது, அவர்களின் எண்ணிக்கை.

7. டாக்கர் கொள்கலனை இயக்கவும்

யாழ் கோப்புறையில் இருப்பதால், கட்டளையை இயக்கவும்

sudo bash ./docker/run.sh

எல்லாம் சரியாக இருந்தால், நீங்கள் ஒரு கொள்கலனுக்கு அழைத்துச் செல்லப்படுவீர்கள், அதில் உங்கள் ஹோம் டைரக்டரியில் உள்ள யாழ் கோப்புறைக்குச் செல்ல வேண்டும்.

cd ~/yalm

8. YaLM 100B இலிருந்து உதாரணத்தை இயக்கவும்

உதாரணங்களில் ஒன்றைத் தொடங்க நாங்கள் தயாராக இருக்கிறோம். அவை இங்கே
விவரிக்கப்பட்டுள்ளன .

chmod +x ./examples/generate_interactive.sh
./examples/generate_interactive.sh

பொறுமையாக இருங்கள், GPT மாதிரி உருவாக்கப்பட்டு சோதனைச் சாவடிகளில் இருந்து எடைகள் ஏற்றப்படும் வரை இன்னும் 10-15 நிமிடங்கள் காத்திருக்க வேண்டும்.
நரம்பியல் நெட்வொர்க் YaLM 100B நடைமுறையில் உள்ளது.

உருவாக்கம் முடிந்ததும், உரையை உருவாக்க ஒரு சூழலை உள்ளிட MegatronML உங்களைத் தூண்டும். நீங்கள் தட்டச்சு செய்யும் போது கவனமாக இருங்கள். சில சூழ்நிலைகளில், ஒரு பிழை ஏற்படுகிறது, நிரல் செயலிழக்கிறது மற்றும் நீங்கள் மீண்டும் சட்டசபையைத் தொடங்க வேண்டும். எனவே, ஒரு கோப்பிலிருந்து உரையை எடுக்கும் எடுத்துக்காட்டுகளைப் பயன்படுத்துவது நல்லது.

9. வேலையின் முடிவுகள்

நரம்பியல் நெட்வொர்க் YaLM 100B நடைமுறையில் உள்ளது.
சுவாரஸ்யமாக தெரிகிறது. நிச்சயமாக, இவை நல்ல உதாரணங்கள் மட்டுமே. நான் வெவ்வேறு மாதிரிகளில் சோதனை நடத்தினேன். எதிர்பார்த்தபடி, சிறந்த சூழல், அதிக அர்த்தமுள்ள உரை உருவாக்கப்படும். சோதனை தலைமுறைகளின் முழு தொகுப்பையும் இணைப்புகளில் பார்க்கலாம்:

விலையைப் பொறுத்தவரை, பயிற்சி மற்றும் தயாரிப்பிலிருந்து தலைமுறைக்கு வெவ்வேறு திறன்களின் சேவையகங்களை வாடகைக்கு எடுப்பதற்கு எனக்கு சுமார் 9 ஆயிரம் ரூபிள் செலவாகும். ஒரு குறிப்பிட்ட ஏமாற்றம் என்னவென்றால், நீங்கள் அனைத்தையும் உடனடியாக உருவாக்க முடியாது. இது தொடங்குவதற்கு மிக நீண்ட நேரம் எடுக்கும் மற்றும் ஒரு மணி நேரத்திற்கு சேவையகத்தின் விலையைப் பொறுத்தவரை, உரை நாம் விரும்பும் அளவுக்கு விரைவாக உருவாக்கப்படாது.
நரம்பியல் நெட்வொர்க் YaLM 100B நடைமுறையில் உள்ளது.

200Gb GPU RAM இல்லாமல் YaLM ஐ இயக்குவது எப்படி?

நீங்கள் config இல் டீப்ஸ்பீட் ஜீரோ ஆஃப்லோடைச் சேர்க்க வேண்டும். நாம் எதைப் பற்றி பேசுகிறோம் என்பதை அறிந்தவர்களுக்கு, அதைச் செய்வது மிகவும் எளிதாக இருக்கும். மற்றவர்களுக்கு, இது ஒரு சிறிய பணி அல்ல. ஆஃப்லோடு CPU RAM அல்லது NVMe இல் இருக்கலாம் என்பதை அறிவது அவசியம். இந்த நேரத்தில் நீங்கள் NVMe பற்றி மறந்துவிடலாம், ஏனெனில். ஒரு பெரிய அளவிலான தரவு செயலாக்கப்படுகிறது மற்றும் வட்டு அதை சமாளிக்க முடியாது. ஜீரோ ஆஃப்லோட் CPU மிகவும் உண்மையானது. உண்மை, இதற்காக உங்களிடம் 200+ ஜிபி CPU ரேம் இருக்க வேண்டும், இது மலிவானது அல்ல. இரண்டு வீடியோ கார்டுகளில் இன்னும் இணையாகச் செய்ய முடியாததால், ஒரு உரை சுமார் 20-40 நிமிடங்களுக்கு உருவாக்கப்படும். கீழே உள்ள ஸ்கிரீன்ஷாட்டில் நீங்கள் பார்க்க முடியும் என, ஒரே ஒரு வீடியோ அட்டை தலைமுறையில் ஈடுபட்டுள்ளது, பின்னர் நினைவகத்தின் கால் பகுதிக்கு மட்டுமே. 24 ஜிபி ஏன் பயன்படுத்தப்படவில்லை என்பதைப் பார்க்க வேண்டும்.
நரம்பியல் நெட்வொர்க் YaLM 100B நடைமுறையில் உள்ளது. சரி, முடிவில், ஒரு RTX 3070 TI இல் கூட இயக்க முடியும் என்று கூறுவேன். ஆனால் இதில் குறிப்பிட்ட உணர்வு எதுவும் இல்லை, ஏனெனில். 96 ஜிபி ரேமின் பிற்சேர்க்கையில் உள்ள ஸ்வாப்பில் 150 ஜிபி டேட்டாவை விரைவாகச் செயல்படுத்த NVMe உங்களை அனுமதிக்காது.
நரம்பியல் நெட்வொர்க் YaLM 100B நடைமுறையில் உள்ளது.

சுருக்கமாகக்

நிச்சயமாக, நான் இன்னும் உகந்த வெளியீட்டு பாதைகளைக் கண்டறிய முயற்சிப்பேன். ஆனால் இதுவரை நான் YaLM 100b மிகவும் விலை உயர்ந்தது / எனது பணிகளுக்கு மிகவும் மெதுவாக உள்ளது என்ற முடிவுக்கு வந்துள்ளேன். அதே பணத்தில், மக்கள் அதிகமாகவும் சிறப்பாகவும் எழுதுவார்கள். ஆனால் இது தற்காலிகமானது என்று நினைக்கிறேன், பார்ப்போம். தொடங்குதல், யாழ் அமைப்பது போன்றவற்றில் உங்களுக்கு உதவி தேவைப்பட்டால் அல்லது உங்கள் சூழல் எடுத்துக்காட்டுகளில் முடிவுகளைப் பார்க்க விரும்பினால், அஞ்சல் அல்லது தந்திக்கு எழுதவும்.