Запитання з тегом «q-learning»

1
Що таке "перегляд досвіду" та які його переваги?
Я читав статтю Google DeepMind Atari і намагаюся зрозуміти поняття "перегляд досвіду". Повтор досвіду з'являється у багатьох інших навчальних роботах з підкріпленням (зокрема, папері AlphaGo), тому я хочу зрозуміти, як це працює. Нижче наведено кілька уривків. По-перше, ми використовували біологічно натхненний механізм, який називають переглядом досвіду, який рандомізує дані, тим …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.