Так само легко стрибати на прокладці, кажучи, що гра Альфа-Нуль є "більш" людиною, ніж попередні комп'ютерні шахові програми, як і стрибати на протилежній фургоні, і сказати, що гра Альфа-Нуль цілком "чужа". Не ясно, що гра «Альфа-нуль» є «більш людською», особливо зважаючи на нашу схильність людини до антропоморфізму.
Шахи як боротьба (людського) розуму
Але в шахах ця тенденція правдива? Магнус Карлсен колись говорив про те, як "традиційні" комп'ютери взагалі не мають людської творчості, кажучи:
"Шахи - це боротьба між розумом людини. Саме це робить його захоплюючим. Комп'ютерний шах є механічним, сухим і м'яким. Звичайно, ходи дуже сильні, але стилю немає. Якщо ви намагаєтеся грати проти шахового комп'ютера , ви не тільки втратите з дуже високою впевненістю, але і вам буде нудно в процесі.
Магнус Карлсен не бачив доказів людських стилів гри в традиційних шахових комп'ютерах. Тож давайте вивчимо, чи нещодавнє досягнення Альфа-Зеро скасувало цю перспективу та перевело нас до чогось більш нагадуючого нас самих.
Якщо під назвою "по-людськи" ви маєте на увазі гру ", яка проявляє поведінку, швидше за все, сподобається нашому почуттю антропоморфізму", чи виглядає стиль Альфа-нуля більш людським? Як ми насправді випробовуємо цього суб'єктивного короткозорого, що люблять проектувати на речі, нелюдські? Давайте запитаємо - чи алгоритм "вибірково вибирає краще" чи демонструє "більш людський творчий вибір" у своєму стилі гри?
Творці алгоритму вказують, що на відміну від Stockfish, який використовує алгоритм пошуку Alpha-Beta, Alpha-Zero використовує алгоритм пошуку дерев Монте-Карло (MCTS), який приймає в якості зважених параметрів θ, побудованих за попередніми результатами ~ Сторінка 3. Освоєння шахів і Шогі від самостійної гри з загальним алгоритмом навчання підсилення ).
Таким чином, алгоритм взагалі не виявляє вибору. Він насправді бере участь у випадковому, але ймовірнісному пошуку Монті-Карло, де можливі шляхи пошуку, які йому доступні, все більше упереджуються попередніми результатами. Чи вибрав Альфа-нуль оптимізувати свій стиль гри таким чином чи це був вибір його програмістів?
Чи завжди у Альфа-нуля є всі можливі рухи, доступні йому для розгляду, чи це деякі рухи алгоритмічно упереджені таким чином, що імітує досвід, який може бути антропоморфно інтерпретований людьми?
Спочатку у нього були доступні всі рухи, тому його «стиль» був цілком випадковим. Однак, оскільки його пошук все більше і оптимальніше обмежується попереднім успіхом чи невдачею, його стиль насправді змінюється до режиму, з яким його програмували програмісти. Це, однак, "більш людське"? Порівняйте це з Магнусом Карлсеном, який іноді обиратиме менш оптимальні рухи, оскільки вони більш креативні :
Магнус Карлсен: "Я вдячний створити щось унікальне"
Шахи як боротьба (чужорідного) розуму
Люди можуть вибирати критерії, які визначають свій власний стиль гри (наприклад, я часто вибирав імпульс та помилку у своєму власному стилі). Багато хто бачить гру «Альфа-нуль» у обох шахах та іде як інопланетянин . Нік Хайнс, студент випускника Лабораторії інформатики та штучного інтелекту MIT (CSAIL), зауважує:
"Ми бачимо тут модель, вільну від людських упереджень і презумпцій: вона може дізнатися все, що вона визначає, оптимальне, що може бути більш нюансованим, ніж наші власні уявлення про те саме. Це як чужа цивілізація, яка вигадує власну математику, яка дозволяє їй робити такі речі, як подорож у часі ... "
Так само ГМ Пітер Хайн Нільсен сказав на Chess.com :
"Прочитавши статтю, але особливо побачивши ігри, я думав, що, я завжди цікавився, як це було б, якби вищий вид висадився на землю і показав нам, як вони грають у шахи. Я відчуваю, що зараз знаю".
Здається, більшість реагує на новий стиль гри «Альфа-нуль» як «чужа гра», а не як «більш людська».
Тому є причина не погоджуватися з відповідями вище, які говорять "так".