Відповіді:
Здається, це стосується тренувань:
Для поворотної мережі було створено та вирішено десять мільйонів ситуацій з поворотом повороту (з моменту розробки картки повороту) із 6144 ядрами процесора дослідницького кластера Calcul Quebec MP2, використовуючи понад 175 основних років часу обчислень. Для флоп-мережі було створено та вирішено один мільйон ситуацій флопу (з моменту розробки карт флопа). Ці ситуації були вирішені за допомогою обмеженого глибинним вирішувачем DeepStack з мережею поворотів, що використовується для контрфактичних значень у державних штатах одразу після картки повороту. Ми використовували кластер з 20 GPUS та половиною GPU року обчислювального часу. Для допоміжної мережі було сформовано десять мільйонів ситуацій, а цільові значення були отримані шляхом перерахування всіх 22100 можливих флопів та усереднення контрфактичних значень з виходу мережі флоп.
І це для фактичної гри:
Обчислення обчислень та нейронної мережі реалізовано в Torch7 (53) і працює на одній графічній карті NVIDIA GeForce GTX 1080.
Для порівняння: Розподілена версія AlphaGo запустила 1.920 процесорів і 280 графічних процесорів.