2
Програмування лінії за роботом з навчанням підкріплення
Я розглядаю можливість програмування рядка за роботом, використовуючи алгоритми навчання посилення. Питання, над яким я замислююсь, полягає в тому, як я можу отримати алгоритм для навчання навігації по будь-якому довільному шляху? Слідуючи за книгою « Саттон і Барто» для навчання підкріплення, я вирішив проблему вправ, пов’язану з іподромом, де автомобільний …