1
Що таке "перегляд досвіду" та які його переваги?
Я читав статтю Google DeepMind Atari і намагаюся зрозуміти поняття "перегляд досвіду". Повтор досвіду з'являється у багатьох інших навчальних роботах з підкріпленням (зокрема, папері AlphaGo), тому я хочу зрозуміти, як це працює. Нижче наведено кілька уривків. По-перше, ми використовували біологічно натхненний механізм, який називають переглядом досвіду, який рандомізує дані, тим …