Контекст: SysID та контролює хлопця, який потрапив у ML.
Я думаю , що відповідь user110686 робить справедливу роботу з пояснення деяких відмінностей. SysID обов'язково стосується динамічних моделей з вхідних / вихідних даних, тоді як ML охоплює більш широкий клас проблем. Але найбільша різниця, яку я бачу, пов'язана з (a) пам'яттю (кількість параметрів); (b) кінцеве використання "вивченої" моделі. Ідентифікація системи - це дуже важливий підхід до обробки сигналів з урахуванням частотної області, аналізу частоти та ін. Деякі МЛ називають це "інженерією функцій".
(a) Пам'ять:SysID став відомим задовго до того, як М.Л. Отже, статистика та обробка сигналів були основною основою для теоретичних основ, а обчислення - лякали. Таким чином, люди працювали з дуже простим класом моделей (Bias-Variance tradeoff) з дуже невеликими параметрами. Ми говоримо максимум про 30-40 параметрів і здебільшого лінійних моделей навіть для тих випадків, коли люди чітко знають, що проблема нелінійна. Однак зараз обчислення дуже дешеві, але SysID ще не вийшов із своєї оболонки. Люди повинні почати розуміти, що у нас набагато кращі датчики, легко оцінюючи 1000 параметрів з дуже багатим набором моделей. Деякі дослідники намагаються використовувати нейронні мережі для SysID, але багато хто, здається, неохоче сприймають їх як "мейнстрім", оскільки теоретичних гарантій не так багато.
(b) Кінцеве використання вивченої моделі: Тепер це одне, що SysID отримав дуже коректно, але багато алгоритмів ML не вдається зафіксувати. Важливо визнати, що для цільових додатків ви обов'язково будуєте моделі, які можна ефективно використовувати для оптимізації в Інтернеті.Ці моделі будуть використовуватися для розповсюдження будь-яких прийнятих управлінських рішень, і коли це налаштовується як оптимальна проблема управління, моделі стають обмеженнями. Тож, використовуючи надзвичайно складну структуру моделі, вона значно ускладнює онлайн-оптимізацію. Також зауважте, що ці рішення в Інтернеті приймаються в масштабі секунд або менше. Запропонована альтернатива полягає в тому, щоб безпосередньо вивчити функцію значення в позаполітичний спосіб для оптимального контролю. Це в основному підкріплення навчання, і я думаю, що між SysID та RL є хороша синергія.