Погане оцінювання запасів


15

Це дослідження

NN - NN

Як бачите, Stockfish дає абсолютну вирішальну перемогу для чорних, хоча це явно нічия !!

Перевірте самі

c4 + - втрачаючий крок, тоді як Ba4 + - правильний.

Що відбувається? Чи не має Stockfish взяти до уваги закритих позицій на всіх ?


5
Існує безліч позицій, які Stockfish не оцінює правильно (включаючи деякі загальні кінцеві ігри).
Кудит

10
Відбувається весь час! Це програмне забезпечення, а не Бог
Девід

4
Мені було б дуже приємно бачити сценарій у подібному ключі, який AlphaZero або Leela Zero оцінюють абсолютно неправильно!
Лише близько

1
@Qudit: Так. Я тільки вказував, що питання має зосереджуватися саме на цьому аспекті, а не починати з позиції, яку я задав. Вибачте, якщо я цього не прояснив.
TonyK

3
@leftaroundabout Leela також постійно оцінює фортеці, дивіться, наприклад, кінець цієї гри у Sufie TCEC: cd.tcecbeta.club/archive.html?season=15&div=sf&game=31 . Насправді, Leela збиває цінність навіть більше, ніж у Stockfish, оскільки досить часто у неї буде нецензурна оцінка, тоді як Stockfish стоїчно показує 0,00, і проходить віки, перш ніж Leela зрозуміє, що опонент не дає їй виграти.
Allure

Відповіді:


25

Stockfish не є ідеальною шаховою суттю, і ви знайшли позицію, коли вона не в змозі сказати - це нічия (принаймні, доки правило 50 ходу не починає і не допомагає підрізатися). Ці позиції називають " фортецями ". Ви можете сказати, що це відбувається, тому що навіть якщо ви вводите рішення, Stockfish все одно оцінює остаточну позицію як -10 або більше. Ці фортечні позиції, де запаси мертвих неправильно, є небагато між собою, але вони існують, і це одна з них.

Існували різні спроби написання коду виявлення фортеці у Stockfish та інших звичайних двигунів, які покликані розпізнати фортеці та зупинити Stockfish відправитися до них, якщо його позиція вища. Якщо у вас є розумна ідея, ви, ймовірно, можете опублікувати її в академічному журналі (див. Публікації у вікі шахопрограмування).


11

Це допомагає зрозуміти, що двигуни насправді не виходять із "стратегії", настільки, як вони дивляться кілька кроків у майбутнє, оцінюють бал позиції та знаходять оптимальний набір ходу.

Велика слабкість цього підходу полягає в тому, що якщо нічого не може відбутися швидко, у двигуна виникнуть проблеми. Це раніше було величезною проблемою з ендграми. Якщо у вас K + B + P проти K + P, ви не вирішите цю позицію лише за кілька кроків. Таким чином, виправленням було додати ендмейг табличних баз до двигунів - просто брутефорс обчислює кожну позицію кінцевої гри достроково і додає їх як бібліотеку для використання двигуном. (Ось чому в більшості дешевих шахових додатків ви можете заробити виграш, просто виживши до кінця гри: тому що у нього немає бази даних ендграйдів.)

Але ваша позиція (зрозуміло) не буде в жодній базі таблиць кінцевих ігор. Тож тваринницька риба повинна розігрувати мільйони позицій, розтягуючись на 10 або більше рухів у майбутнє ... лише для того, щоб виявити, що в усіх них чорний колір сильно зафіксований у матеріалі. Це безумовно не може відтворити ~ 56 рухів для повного дерева рішень - це те, що потрібно для визначення остаточного розіграшу.


0

Інші відповіді добре висвітлюють це питання, але цікаво, що не всі програми не розуміють, що це нічия. Я підключив це до свого комп’ютера, і як член ChessBase Premium у мене також є доступ до хмарних двигунів.

Один із цих хмарних двигунів оцінив це як нічию майже миттєво. Хочеться лише, щоб було більше інформації, ніж просто "Новий двигун".

введіть тут опис зображення

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.