Чому шахові експерти були здивовані перемогою AlphaZero проти Stockfish?


10

Це було недавно доведено до мого відомості , що фахівці з шахів взяли результат цього нині знаменитого матчу , як що - то засмучений.

Дивіться: Новий найкращий гравець у шахи - це безстрашний, алгоритм розгортки

Як не експерт з шахів і шахів AI, моє припущення було те, що на основі продуктивності AlphaGo та валідації цього типу методу стосовно комбінаторних ігор було те, що у старшого ШІ не буде шансів.

  • Чому перемога AlphaZero дивувала?

Відповіді:


14

Хороше питання.

Перше і найголовніше - це те, що в Go deepmind не було супергуманних супротивників, які б могли кинути виклик. Двигуни Go були не де-небудь поруч із найвищим рівнем найкращих гравців людини. Однак у шахах двигуни на 500 ELO очок сильніші за найкращих гравців. Це величезна різниця. Обсяг роботи, який перейшов у сучасні шахові двигуни, приголомшує. Ми говоримо про мільйони годин програмування, сотні тисяч ітерацій. Це масивний масив знань і праці. Подолати і перевершити все це за 4 години є приголомшливим.

По-друге, не стільки сам результат дивує шахових майстрів, а замість того, як AlphaZero грає в шахи. Досить іронічно, що система, яка не мала людських знань чи досвіду, грає найбільше, як ми. Двигуни горезвісні для того, щоб грати в некрасиві рухи, ті, у яких не вистачає гармонії і т. Д. Важко пояснити не шахістці, але є таке поняття, як "штучний хід", як часто зустрічаються сучасні двигуни. AlphaZero взагалі не грає так. Він має дуже людський стиль, де він домінує над фігурами суперника глибокою стратегічною грою та приголомшливими позиційними жертвами. AlphaZero грає так, як ми прагнемо, поєднуючи глибоке розуміння позиції з точністю розрахунку двигунів.

Редагувати О, і я забув щось згадати про сам результат. Якщо ви не знайомі з комп'ютерними шахами, це може здатися не приголомшливим, але це так.

В наші дні поля перемоги, які розділяють верхні сучасні двигуни, тонкі. У 100 ігрових матчах можна було очікувати, що ви побачите такий результат, як 85 розіграних ігор, 9 перемог та 6 втрат, щоб визначити кращий двигун.

28 перемог і 72 нічиї з нульовими втратами було потойбічним та було немислимим аж до того моменту, як це сталося.


Гарна відповідь. Ваша думка щодо порівняння між шаховими командами AI є цікавою з точки зору обмеження, що ґрунтується на шаховій розбещеності та тріаді «Виграш / програш / нічия». (Можливо, в майбутньому нам знадобляться кінцеві, нерозбірливі ігри, які дозволяють більш детально проаналізувати з точки зору результатів.) Я знайомий з історією шахових двигунів, і з величезною кількістю зусиль та людських знань, які потрапили в них, але контекст відсутності успіху знову: набагато складніший 19x19 Go мав протилежне розгалуження для мене.
DukeZhou

Зокрема, моє припущення полягало в тому, що якщо AlphaGo зможе перемогти топ-людей у ​​значно складнішій грі, здавалося б розумним, що він бив би не тільки перших людей, але і попередніх AI в будь-якій іншій грі.
DukeZhou

Трохи про штучні рухи є досить важливим, і не те, про що я бачив, як не шахісти говорять. +1
Стелла Бідерман

4

MCTS для шахів було випробувано в літературі з невеликим успіхом. Передбачалося, що підхід AlphaGo ніколи не буде працювати в шахах, можливо, в Go, але не в шахах. Раптом Google оголосив, що підхід працює, і він переміг найсильнішу шахову програму у світі з великою перевагою.

До Google усіх шахових програмістів навчали майстерності евристики в програмуванні двигунів було кращою стратегією, ніж машинне навчання. Як би ви не реалізували нейронні мережі, вона ніколи не працювала б швидше, ніж купа 64-бітних інструкцій бітбордів. AlphaGo бігав досить повільно , але він грав у найсильніші шахи.


2

Я бачу, виходячи з наданих вами статей, безліч сюрпризів від перемоги:

Шахи важко освоїти, і зустрічна частина мала найкращі світові практики, AlphaZero мав табула-расу.

Навчання зайняло чотири години, і AlphaZero програв не 100 матчів.

Стиль гри був чужорідною сумішшю людського та комп’ютерного типу рухів, агресивних і часом здається тужливими жертвами, які не мають уявлення, але насправді посилюють майбутній статус.

Кількість можливостей, врахованих за ходу, було менше, ніж зустрічна частина, AlphaZero мав загадкове відчуття кишечника чи інтуїцію.

Засмучене відчуття виникало через кількість навчального матеріалу, який AlphaZero створив із самим собою та обмеженням часу, що, можливо, не дало традиційній машині справедливої ​​кількості часу.


Ааа. Таким чином, це було пов'язано з недовірою до нового методу ШІ. Що має сенс.
DukeZhou
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.