Співвідношення та різниця між часовими рядами та регресом?


12

Які відношення та різниця між часовими рядами та регресом?

Чи правильно для моделей та припущень регресійні моделі передбачають незалежність між вихідними змінними для різних значень вхідної змінної, тоді як модель часових рядів не робить? Які ще інші відмінності?

Для методів - з веб-сайту Дарлінгтона

Існує ряд підходів до аналізу часових рядів, але найбільш відомими є метод регресії та метод Box-Jenkins (1976) або ARIMA (AutoRegressive Integrated Moving Average). Цей документ вводить метод регресії. Я вважаю, що метод регресії набагато перевершує ARIMA з трьох основних причин

Я не зовсім розумію, що таке "метод регресії" для часових рядів на веб-сайті, і чим він відрізняється від методу Box-Jenkins або ARIMA. Я вдячний, якщо хтось може дати деяку інформацію з цих питань.

Дякую та з повагою!


2
Більшість відповідей та коментарів тут зосереджені на більш конкретному питанні до кінця. Це лише прапор, що аналіз часових рядів - це набагато, набагато більше, ніж Box-Jenkins або ARIMA. Цілі сфери аналізу часових рядів мають цілком різну (або хоча б більш загальну) спрямованість. Моделі без спостережень за компонентами - лише один із кількох прикладів.
Нік Кокс

Відповіді:


17

Я дійсно вважаю, що це гарне запитання і заслуговує на відповідь. Надане посилання написано психологом, який стверджує, що якийсь метод домашньої заварки - це кращий спосіб аналізу часових рядів, ніж Box-Jenkins. Я сподіваюся, що моя спроба відповіді спонукає інших, більш обізнаних про часові ряди, внести свій внесок.

З його вступу, схоже, Дарлінгтон відстоює підхід просто поміщати модель AR за найменшими квадратами. Тобто, якщо ви хочете підігнати модель

zт=α1zт-1++αкzт-к+εт
zтzт12кarфункція. Я перевірив це, і він, як правило, дає подібні відповіді на метод за замовчуванням для встановлення моделі AR в Р.

zттт

Але, схоже, він також виступає за перевищення розміру, а потім використовує зменшення похибки середнього квадрата між встановленими рядами та даними як свідчення того, що його метод кращий. Наприклад:

Я відчуваю, що корелограми зараз застаріли. Їх головне призначення полягало в тому, щоб працівники могли здогадатися, які моделі найкраще відповідають даним, але швидкість сучасних комп'ютерів (принаймні, в регресії, якщо не в підгонці моделей часових рядів) дозволяє працівнику просто встановити кілька моделей і побачити, як саме кожен з них відповідає розміру середньої квадратичної помилки. [Питання про капіталізацію випадковості не має відношення до цього вибору, оскільки два методи однаково чутливі до цієї проблеми.]

Це не дуже гарна ідея, оскільки тест моделі повинен бути настільки вдалим, який він може прогнозувати, а не наскільки він відповідає наявним даним. У своїх трьох прикладах він використовує "скориговану похибку середньоквадратичного кореня" як свій критерій якості придатності. Звичайно, надмірна відповідність моделі зробить оцінку помилок у вибірці меншою, тому його твердження про те, що його моделі "кращі", оскільки вони мають менший RMSE, є помилковим.

Коротше кажучи, оскільки він використовує неправильний критерій для оцінки того, наскільки хороша модель, він приходить до неправильних висновків щодо регресії проти ARIMA. Я б став до того, що якби він перевіряв спроможність прогнозування моделей, ARIMA вийшов би на перше місце. Можливо, хтось може спробувати це, якщо у них є доступ до книг, про які він згадує тут .

[Доповнення: для більш детальної ідеї регресії ви можете перевірити старіші книги тимчасових рядів, які були написані до того, як ARIMA стала найпопулярнішою. Наприклад, у Kendall, Time-Series , 1973, глава 11 є ціла глава про цей метод та порівняння з ARIMA.]


Питання в тому, які (притаманні) відмінності?
hbaghishani

Наскільки я можу сказати, автор ніколи не описував свій метод домашнього приготування у рецензованій публікації, а посилання на статистичну літературу та зі статистичної літератури видаються мінімальними, а його основні публікації з методичної тематики сягають 70-х років. Власне кажучи, ніщо з цього нічого не «доводить», але не маючи достатньо часу або досвіду для самої оцінки претензій, я б вкрай неохоче використовував будь-яку з них.
Гала

Суттєва відмінність @hbaghishani полягає в тому, що автокорельовані дані, тобто в межах кожного ряду, спотворюють перехресну кореляційну інтерпретацію. Крім того, необхідно враховувати / виправляти Гауссові порушення, наприклад, постійне середнє значення помилок, постійну дисперсію за часом, постійні параметри в часі.
IrishStat

@flounderer Люди пишуть підручники, щоб продати їх та отримати нагороди. Вони іноді включають анахронічні методи, які викладаються неправильно, тому що в якусь більш ранню дату їх вважали правильними. Для збільшення продажів видавець часто вимагає (з мого особистого досвіду) застарілу, але неправильну методологію, оскільки ці методи знаходяться в програмі.
IrishStat

Моделювання автокорельованих даних @IrishStat може здійснюватися за допомогою моделей динамічної регресії. Також такі моделі, як змішані моделі, можуть бути використані для таких даних. Отже, я не думаю, що ця особливість є суттєвою різницею.
hbaghishani

7

Професор Е. Парзен, можливо, дещо заздрив, що він не пропонував інноваційних методів Бокса і Дженкінса, запропонував такий підхід перестаратися, а потім відмовитися. Він провалюється з багатьох причин (багато з яких Flounderer добре підсумував), включаючи не ідентифікацію та виправлення імпульсів, зміни рівня, сезонні імпульси та місцеві тенденції часу. Крім того, необхідно враховувати зміни параметрів у часі або зміни дисперсії помилок у часі.

Я написав твір, який може вас зацікавити. Він називається "Регресія проти Box-Jenkins" і доступний на веб-сайті http://www.autobox.com/cms/index.php/afs-university/intro-to-forecasting / doc_download / 24-regression-vs-box-jenkins

Один коментар щодо процедури Дарлінгтона, що відображає час, час * час, час * час * час * час як прогнози. За відсутності виявлення втручання, що призводить до виокремлення зовнішніх ефектів, цілком можливо (і неправильно!) Зробити висновок про більш високі сили часу. Остерігайтеся нестатистів, які виконують статистичний аналіз, як ви б насторожено ставились до статистиків, які виконують операцію на мозку. Справедливості можна також остерігатися статистиків / математиків, що намагаються виконувати аналіз часових рядів з обмеженим навчанням аналізу часових рядів.

Інші плакати (зокрема, побічні) у цьому списку неодноразово застерігали від використання цього «підхідного підходу», здебільшого в одноманітній обстановці. Це попередження стосується також причинних моделей.

Сподіваюсь, це допомагає.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.