Поважний теоретичний алгоритм графіку A * з найкоротшим шляхом та наступні вдосконалення (наприклад, Ієрархічна анотація A *) - це явно техніка вибору для проходження маршруту в розробці гри.
Натомість мені просто здається, що RL - це більш природна парадигма для переміщення персонажа навколо ігрового простору.
І все-таки я не знаю жодного розробника ігор, який впровадив механізм маршрутизації на основі Reinforcement Learning. (Я не випливаю з цього, що застосування RL в доріжці маршрутів дорівнює 0, тільки що це дуже мало відносно A * та друзів.)
Незалежно від причини, це не тому, що ці розробники не знають про RL, про що свідчить той факт, що RL часто використовується в інших місцях ігрового двигуна.
Це запитання не є приводом для того, щоб запропонувати думку щодо RL у проходженні маршрутів; насправді я припускаю, що мовчазна перевага A * та ін. над RL правильно - але це явно не вважає за краще, і мені дуже цікаво про причину цього, особливо від тих, хто намагався використовувати RL для проходження маршруту.