געפונען אין tensorflow-js וואָס איר דאַרפֿן פֿאַר די ערשטער סטעפּס אין ML און טריידינג.
דאָס איז דקן טריינינג ווו ריוואָרדז און פּענאַלטיז זענען געגעבן צו דער אַגענט פֿאַר אַקשאַנז.
https://github.com/tensorflow/tfjs-examples/tree/master/snake-dqn
https://storage.googleapis.com/tfjs-examples/snake-dqn/index.html
עס טורנס אויס מיר האָבן אַ שלאַנג וואָס לערנט פון זיין אייגענע דערפאַרונג צו רירן. זי האט אַ זיכער נומער פון מאָוועס (קער אָדער פאָרזעצן) און איר אַרבעט איז צו באַקומען צו די פרוכט. טכילעס, דער שלאַנג טוט נישט וויסן ווי, אָבער אין די לויף פון טריינינג, עס גיינז די פיייקייט צו געפֿינען פירות און דאַדזש. עס איז זייער ענלעך צו טריידינג, איז ניט עס?
נו, אין מינדסטער פֿאַר אונדזער אַרבעט, ווען מיר האָבן דאַטן פליסנדיק, און דער ראָבאָט דאַרף צו מאַכן אַ באַשלוס צו קויפן אָדער פאַרקויפן.
די מינוס פון די שלאַנג איז אַז עס איז געשריבן פֿאַר node.js, און מיר דאַרפֿן צו קענען צו באַן אין דעם בלעטערער (אַזוי אַז יעדער באַניצער קענען טאָן דאָס). דעריבער האָט מען געמוזט טאָן דאָס זעלבע אויפן קליענט.
איך דראַגד די שלאַנג ווי עס איז צו מיין בלאַט מיט אַ טשאַרט און געפרוווט צו קאַטער עס. עס איז נישט דאָרט!
דער שלאַנג האָט זיך אומגעקערט
ערשטער פּאַקאַץ,
דערנאָך טענות. (אגב, איך אויך געמאכט אַ ציען בעטן ווייַטער צו די פאַרריכטן https://github.com/tensorflow/tfjs-examples/pull/353),
דעמאָלט %% אַנכאַנדאַלד רידזשעקשאַן (טיפּערראָר): קענען ניט רופן אַ קלאַס ווי אַ פֿונקציע%%. וואָס איז ריפּערד דאָ https://github.com/tensorflow/tfjs/pull/3906/files, אָבער זינט עס איז נאָך קיין מעלדונג, אַזוי איך האט צו פאַרבייַטן עס מיט מיין הענט. דאָ, דורך דעם וועג, פילע מענטשן האָבן אַ פּראָבלעם https://github.com/tensorflow/tfjs/issues/3384.
מיינערז האָבן שוין געגאנגען ווייַטער, ווי ריפּלייסינג אַרבעט פון fs מיט indexeddb. אַרבעט מיט וואָס איך ספּיעד דאָ, דורך די וועג. נו, אין אַלגעמיין, וואָגן-פלאָקן טכילעס ינספּייערד מיר צו טאָן אַלץ אויף דעם קליענט.
https://github.com/tensorflow/tfjs-examples/tree/master/cart-pole
https://storage.googleapis.com/tfjs-examples/cart-pole/dist/index.html
אין די סוף, דאָס איז וואָס געטראפן:
https://github.com/pskucherov/opexflow/pull/16/files
נו, אין פאַקט, דער ווייַטער שריט וועט זיין:
- פּאַסיק צו טשאַרץ
- וויסואַליזאַטיאָן
- באַן די ראָבאָט אויף באַוווסט דאַטן צו ווייַזן די מאַקסימום רעזולטאַט
ונטער איז אַ ווידעא דעמאָ פון די אַרבעט טריינינג פון ראָובאַץ אויף דעם קליענט. אמאל וועלן זיי אויך האנדלען מיט סבערבאנק פיוטשערס אנשטאט מיר.