У навчанні підкріплення часто використовується лінійне наближення функції, коли є великі простори стану. (Коли шукати таблиці стають нездійсненними.)
Форма значення з наближенням до лінійної функції задається числом
де - ваги, а - особливості.f i
Функції заздалегідь визначені користувачем. Моє запитання: як призначаються ваги?
Я прочитав / завантажив деякі слайди лекцій з навчання з наближенням до функції. Більшість з них мають слайди за лінійною регресією, що слідує за цим. Оскільки вони є лише слайдами, вони, як правило, неповні. Цікаво, який зв’язок / відношення між двома темами.