Мені цікаво, як навчити нейронну мережу для настільних ігор на круговій основі, таких як «тик-так», «шахи», «ризик» або будь-яка інша гра на основі круглих сторін. Наступний хід шляхом виведення здається досить прямим вперед, подаючи ігровий стан у якості входу та використовуючи вихід як рух для поточного гравця. Однак навчання ІС з цією метою не здається таким прямим, тому що:
- Можливо, не буде рейтингу, якщо один хід хороший чи ні, тому тренування одинарних ходів не здається правильним вибором
- Використання всіх станів гри (входів) та рухів (виходів) всієї гри для тренування нейронної мережі не здається правильним вибором, оскільки не всі рухи в програній грі можуть бути поганими
Тож мені цікаво, як тренувати нейронну мережу для круглої настільної гри? Я хотів би створити нейронну мережу для тик-так-носка за допомогою тензорфлоу.