DeepMind заявляють, що їх глибока Q-мережа (DQN) змогла постійно адаптувати свою поведінку під час навчання 49 ігор Atari.
Вивчивши всі ігри з однаковою нейронною мережею, чи був агент, здатний одночасно грати у них на «надлюдських» рівнях (коли б це було випадково представлено однією з ігор), чи міг би бути гарним лише в одній грі, вимагали перевчення?