snake-dqn ເປັນເສັ້ນທາງໄປສູ່ ML

Программирование

ພົບໃນ tensorflow-js ສິ່ງທີ່ທ່ານຕ້ອງການສໍາລັບຂັ້ນຕອນທໍາອິດໃນ ML ແລະການຊື້ຂາຍ.

ນີ້ແມ່ນການຝຶກອົບຮົມ dqn ບ່ອນທີ່ລາງວັນແລະການລົງໂທດຖືກມອບໃຫ້ຕົວແທນສໍາລັບການກະທໍາ.

https://github.com/tensorflow/tfjs-examples/tree/master/snake-dqn

https://storage.googleapis.com/tfjs-examples/snake-dqn/index.html

ມັນ turns ອອກວ່າພວກເຮົາມີງູທີ່ຮຽນຮູ້ຈາກປະສົບການຂອງຕົນເອງເພື່ອຍ້າຍ. ນາງມີຈໍານວນການເຄື່ອນໄຫວທີ່ແນ່ນອນ (ຫັນຫຼືສືບຕໍ່) ແລະວຽກງານຂອງນາງແມ່ນເພື່ອໄປຫາຫມາກ. ໃນເບື້ອງຕົ້ນ, ງູບໍ່ຮູ້ວິທີການ, ແຕ່ໃນໄລຍະການຝຶກອົບຮົມ, ມັນໄດ້ຮັບຄວາມສາມາດໃນການຊອກຫາຫມາກໄມ້ແລະ dodge. ມັນຄ້າຍຄືກັນກັບການຊື້ຂາຍຫຼາຍ, ບໍ່ແມ່ນບໍ?

ດີ, ຢ່າງຫນ້ອຍສໍາລັບວຽກງານຂອງພວກເຮົາ, ເມື່ອພວກເຮົາມີຂໍ້ມູນແລ່ນ, ແລະຫຸ່ນຍົນຈໍາເປັນຕ້ອງຕັດສິນໃຈຊື້ຫຼືຂາຍ.

ລົບຂອງງູແມ່ນວ່າມັນຖືກຂຽນສໍາລັບ node.js, ແລະພວກເຮົາຈໍາເປັນຕ້ອງສາມາດຝຶກອົບຮົມໃນຕົວທ່ອງເວັບ (ເພື່ອໃຫ້ຜູ້ໃຊ້ໃດກໍ່ຕາມສາມາດເຮັດໄດ້). ເພາະສະນັ້ນ, ດຽວກັນຕ້ອງເຮັດກັບລູກຄ້າ.

ຂ້າພະເຈົ້າໄດ້ລາກງູຍ້ອນວ່າມັນໄປຫາຫນ້າຂອງຂ້ອຍດ້ວຍຕາຕະລາງແລະພະຍາຍາມເປີດຕົວມັນ. ມັນບໍ່ຢູ່ທີ່ນັ້ນ!

ງູໄດ້ຕໍ່ສູ້ຄືນ

ການຫຸ້ມຫໍ່ທໍາອິດ,

ຫຼັງຈາກນັ້ນ, ການໂຕ້ຖຽງ. (ໂດຍວິທີທາງການ, ຂ້າພະເຈົ້າຍັງໄດ້ຮ້ອງຂໍການດຶງຕໍ່ໄປກັບການແກ້ໄຂ https://github.com/tensorflow/tfjs-examples/pull/353),

ຈາກນັ້ນ %%ການປະຕິເສດທີ່ບໍ່ຖືກຈັດການ (TypeError): ບໍ່ສາມາດເອີ້ນຫ້ອງຮຽນເປັນຟັງຊັນ%%. ເຊິ່ງກໍາລັງສ້ອມແປງຢູ່ນີ້ https://github.com/tensorflow/tfjs/pull/3906/files, ແຕ່ນັບຕັ້ງແຕ່ ຍັງບໍ່ທັນມີການປ່ອຍເທື່ອ, ສະນັ້ນຂ້ອຍຕ້ອງປ່ຽນມັນດ້ວຍມືຂອງຂ້ອຍ. ນີ້, ໂດຍວິທີທາງການ, ປະຊາຊົນຈໍານວນຫຼາຍມີບັນຫາ https://github.com/tensorflow/tfjs/issues/3384.

ເດັກນ້ອຍໄດ້ໄປອີກແລ້ວ, ເຊັ່ນ: ການທົດແທນການເຮັດວຽກຈາກ fs ດ້ວຍ indexeddb. ເຮັດວຽກກັບທີ່ຂ້າພະເຈົ້າໄດ້ spied ທີ່ນີ້, ໂດຍວິທີທາງການ. ດີ, ໂດຍທົ່ວໄປ, cart-pole ໃນເບື້ອງຕົ້ນໄດ້ດົນໃຈຂ້າພະເຈົ້າໃຫ້ເຮັດທຸກສິ່ງທຸກຢ່າງກ່ຽວກັບລູກຄ້າ.

https://github.com/tensorflow/tfjs-examples/tree/master/cart-pole

https://storage.googleapis.com/tfjs-examples/cart-pole/dist/index.html

ໃນທີ່ສຸດ, ນີ້ແມ່ນສິ່ງທີ່ເກີດຂຶ້ນ:

https://github.com/pskucherov/opexflow/pull/16/files

ແທ້ຈິງແລ້ວ, ຂັ້ນຕອນຕໍ່ໄປຈະເປັນ:

  1. ພໍດີກັບຕາຕະລາງ
  2. ການເບິ່ງເຫັນ
  3. ຝຶກອົບຮົມຫຸ່ນຍົນກ່ຽວກັບຂໍ້ມູນທີ່ຮູ້ຈັກເພື່ອສະແດງໃຫ້ເຫັນຜົນໄດ້ຮັບສູງສຸດ

ຂ້າງລຸ່ມນີ້ແມ່ນວິດີໂອຕົວຢ່າງຂອງການຝຶກອົບຮົມການເຮັດວຽກຂອງຫຸ່ນຍົນຢູ່ໃນລູກຄ້າ. ມື້ຫນຶ່ງພວກເຂົາຍັງຈະຊື້ຂາຍອະນາຄົດຂອງ Sberbank ແທນຂ້ອຍ.

pskucherov
Rate author
Add a comment