Аналіз серій разів проти машинного навчання?


10

Просто загальне питання. Якщо у вас є дані часових рядів, коли краще використовувати методи часових рядів (ака, ARCH, GARCH тощо) над машинними / статистичними методами навчання (KNN, регресія)? Якщо є подібне запитання, яке існує на перекваліфікованій, будь ласка, вкажіть мене на це - подивився і не зміг його знайти.


Відповіді:


9

Типові методи машинного навчання передбачають, що ваші дані незалежні та однаково розподілені, що не відповідає дійсності даних часових рядів. Тому вони є невигідними порівняно з методами часових рядів з точки зору точності. Для прикладів цього див. Попередні запитання Впорядкування часових рядів для машинного навчання та випадкових лісів є надмірним .


Дякую за Вашу відповідь. Наголошуючи, здається, що машинне навчання більше стурбовано пошуку зв’язків у даних, тоді як аналіз часових рядів більше стосується правильного виявлення причин даних - тобто того, як на це впливають стохастичні фактори. Чи згодні ви з цим?
Nagy

4
Ні, я б не погодився з цим підсумком.
Том Мінька

4

Френсіс Дієлд недавно опублікував у своєму блозі "ML та Metrics VI: Ключова різниця між ML та TS Econometrics" . Я надаю скорочену версію, тому вся кредита йому належить. (Наголос жирним шрифтом - мій.)

[S] татистичне машинне навчання (ML) та економетрика часових рядів (TS) мають багато спільного. Але є й цікава відмінність: акцент МР на гнучкому непараметричному моделюванні умовно-середньої нелінійності не грає великої ролі в ТС. <...>

[T] ось дуже мало доказів важливої ​​умовно-середньої нелінійності коваріаційно-стаціонарної (децентралізованої, десезонізованої) динаміки більшості економічних часових рядів. <...> Дійсно, я можу придумати лише один тип умовно-середньої нелінійності, що виявився як неодноразово важливий для (принаймні деяких) економічних часових рядів: динаміка комутації в стилі Гамільтона Маркова.

[Звичайно, в приміщенні є нелінійний слон: динамічний тип типу GARCH у англійському стилі. Вони надзвичайно важливі у фінансовій економетрії, а іноді й у макроеконометрії, але вони стосуються умовних дисперсій, а не умовних засобів.]

Отже, в TS є лише дві важливі нелінійні моделі, і лише одна з них говорить про умовно-середню динаміку. І що важливо, вони обидва дуже щільно параметричні, пристосовані до спеціалізованих особливостей економічних та фінансових даних.

Таким чином, висновок такий:

ML підкреслює наближення нелінійних умовно-середніх функцій у гнучкому непараметричному способі. Це виявляється вдвічі непотрібним у ТС: Існує просто не так багато умовно-середньої нелінійності, щоб турбуватися, а коли є періодично, це, як правило, вузькоспеціалізований характер, найкраще апробований у вузькоспеціалізованому (тісно-параметричному) моді .

Я рекомендую прочитати весь оригінальний пост тут .


+1. Я дуже згоден з цією відповіддю. Типові методи ML характеризуються непараметричним моделюванням і мають дуже розслаблені припущення, тоді як моделі ARMA є "жорстко-параметричними".
Дігіо

2

Як зазначає @Tom Minka, більшість методів МЛ передбачають вхідні дані. Однак є кілька рішень:

  1. Можна використовувати всі зразки минулого часового ряду в системі "Пам'ять" як один функціональний вектор, тобто: x = [x (t-1), x (t-2), ... x (tM)]. Однак у цьому є 2 питання: 1) залежно від вашого бінінгу, у вас може бути величезний векторний ознак. 2- деякі методи вимагають, щоб функції всередині функціонального вектора були незалежними, що тут не так.

  2. Існує багато методик ML, які спеціально розроблені для таких даних часових рядів, наприклад, приховані моделі Маркова, які дуже успішно використовуються для виявлення захоплення, обробки мови тощо.

  3. Нарешті, підхід, який я застосував, полягає у використанні методів «вилучення особливостей» для перетворення проблеми динамічної регресії (яка має елемент часу) у статичну. Наприклад, підхід до режиму основної динаміки (PDM) відображає вхідний вектор функцій минулого ([x (t-1), x (t-2), ... x (tM)]]) на статичний ([v ( 1), v (2). . " Літописи біомедичної інженерії 25.2 (1997): 239-251 ...

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.