Запитання з тегом «combinatorial-games»

4
Як поводитися з недійсними рухами в навчанні підкріплення?
Я хочу створити AI, який може грати з п’яти в ряд / гомоку. Як я вже згадував у назві, я хочу використовувати для цього підкріплення. Я використовую метод градієнта політики , а саме REINFORCE з базовою лінією. Для наближення значення та політики я використовую нейронну мережу . Він має згорнуті …

1
Нейронні мережі проти генетичних алгоритмів у таких іграх, як Tic Tac Toe?
В даний час я роблю проект, який стосується створення AI для гри в гру Gomoku (Це як tic tac toe, але грається на дошці 15 * 15 і для перемоги потрібно 5 підряд). Я вже успішно реалізував ідеальний інтелектуальний інтелект AI, використовуючи навчання Q та маючи стани / дії ігор, …

1
Кілька сумнівів щодо застосування підкріплюючого навчання до ігор, як шахи
Я винайшов шахову настільну гру. Я побудував двигун, щоб він міг грати автономно. Двигун - це в основному дерево рішень. Складається з: Функція пошуку, яка на кожному вузлі знаходить усі можливі юридичні кроки Функція оцінювання, яка присвоює числовому значенню позицію на дошці (позитивне означає, що перші гравці отримують перевагу, негативне …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.