Штучний інтелект proofs

Чому Q-навчання не збігається при використанні наближення функції?

Табличний алгоритм Q-навчання гарантовано знайде оптимальний QQQ функція, Q∗Q∗Q^*, за умови виконання наступних умов (умови Роббінса-Монро ) щодо рівня навчання ∑tαt(s,a)=∞∑tαt(s,a)=∞\sum_{t} \alpha_t(s, a) = \infty ∑tα2t(s,a)<∞∑tαt2(s,a)<∞\sum_{t} \alpha_t^2(s, a) < \infty де αt(s,a)αt(s,a)\alpha_t(s, a) означає ступінь навчання, що використовується при оновленні QQQ значення, пов'язане зі станом sss і дії aaa на …

12 reinforcement-learning q-learning deep-rl proofs function-approximation

Доказ того, що штучний загальний інтелект можливий

В інформатиці передбачається, що людський розум може бути відтворений за допомогою машини Тьюрінга, тому можливий штучний загальний інтелект (AGI). Припускати інакше - це вірити в щось містичне, а містичні вірування - хибні. Я не знаю жодного іншого аргументу про те, що AGI можливий, і попередній аргумент надзвичайно слабкий. Чи є …

11 philosophy agi proofs

Запитання з тегом «proofs»