Шукаю певного типу пояснення ARIMA


25

Це може бути важко знайти, але я хотів би, щоб читати добре пояснив приклад ARIMA , що

  • використовує мінімальну математику

  • розширює дискусію поза побудовою моделі на використання цієї моделі для прогнозування конкретних випадків

  • використовує графіку, а також числові результати для характеристики відповідності між прогнозованими та фактичними значеннями.

Відповіді:


7

Я запропонував прочитати для вступу до моделювання ARIMA

Прикладний аналіз часових рядів для соціальних наук 1980 р. Макклеарі; Р. А. Сіно; EE Meidinger; Д Макдоуал

Це спрямовано на соціологів, тому математичні вимоги не надто жорсткі. Також для коротших процедур я запропонував би дві книги про мудрець із зеленого кольору (хоча вони повністю виходять із книги МакКлері),

Текст Ostrom - це лише моделювання ARMA і не обговорює прогнозування. Я не думаю, що вони також відповідатимуть вашій вимозі щодо помилки прогнозування графіків. Я впевнений, що ви могли б набрати більше корисних ресурсів, вивчивши питання, позначені часовими рядами, а також на цьому форумі.


Книга МакКлері чудово написана, лаконічна і справді хороший вступ. В останній главі також є чудовий ненавмисний гумор, де вони говорять про такі мови високого рівня, як Fortran.
richiemorrisroe

31

Я спробую відповісти на лагідне заклик Уабера просто «відповісти на питання» і залишитися на темі. Нам надається 144 місячні читання серії, що називається "Серія авіакомпаній". Бокс і Дженкінс широко піддавали критиці за те, що вони дали прогноз, який був дико на високій стороні через "вибуховий характер" зворотної реєстрації перетворень.введіть тут опис зображення

Візуально ми створюємо враження, що дисперсія оригінальної серії збільшується із рівнем серії, що говорить про необхідність трансформації. Однак ми знаємо, що однією з вимог до корисної моделі є те, що дисперсія «помилок моделі» повинна бути однорідною. Немає припущень щодо дисперсії оригінальної серії. Вони ідентичні, якщо модель просто константа, тобто y (t) = u. Як /stats//users/2392/probabilityislogic так чітко заявив у своїй відповіді на Раду щодо пояснення гетерогенності / гетеросценадактики "одне, що мені завжди цікаво - це" ненормальність даних ", яка хвилює людей о. Дані не потрібно нормально поширювати, але термін помилки є »

Рання робота у часових рядах часто помилково переходила до висновків про необґрунтовані перетворення. Ми виявимо тут, що виправна трансформація цих даних полягає в тому, щоб просто додати три індикаторні манекени серії до моделі ARIMA, що відображають коригування для трьох незвичайних точок даних. Далі наводиться графік функції автокореляції, що передбачає сильну автокореляцію при відставанні 12 (.76) та при відставанні 1 (.948). Автокореляції - це просто коефіцієнти регресії в моделі, де y - залежна змінна, передбачувана затримкою y.

введіть тут опис зображення! введіть тут опис зображення

Наведений вище аналіз свідчить про те, що в одній моделі розглядаються перші відмінності ряду і вивчається «залишковий ряд», який за своїми властивостями спочатку ідентичний першим відмінностям. введіть тут опис зображення

Цей аналіз підтверджує думку про існування сильної сезонної структури в даних, які можна було б виправити чи змоделювати за допомогою моделі, яка містила двох операторів розрізнення.

введіть тут опис зображення введіть тут опис зображення

Це просте подвійне диференціювання дає набір залишків, так само скоригованого ряду або вільно кажучи, трансформованого ряду, який виявляє незмінні дисперсії, але причиною непостійної дисперсії є непостійна середня кількість залишків. Ось сюжет подвійно різниться ряд, припускаючи три аномалії в кінці серії. Автокореляція цієї серії помилково вказує на те, що «все добре» і може бути необхідне будь-яке коригування Ma (1). Необхідно бути обережними, оскільки в даних є припущення про аномалії, тому ACF зміщується вниз. Це відомо як "Ефект Аліси в країні чудес", тобто прийняття нульової гіпотези про відсутність підтвердженої структури, коли ця структура маскується порушенням одного з припущень.

введіть тут опис зображення введіть тут опис зображення

Ми візуально виявляємо три незвичайні точки (117,135,136)

введіть тут опис зображення

Цей крок виявлення людей, що вижили, називається виявленням втручання і може бути запрограмований легко, або не так легко, слідуючи наступній роботі Цая.

введіть тут опис зображеннявведіть тут опис зображення

Якщо до моделі додати три показники, отримаємо введіть тут опис зображення

Тоді ми можемо оцінити

введіть тут опис зображення

І отримати сюжет залишків та ACF

введіть тут опис зображення

введіть тут опис зображення

Цей ACF дозволяє нам додати до моделі потенційно два коефіцієнти ковзних середніх. Таким чином, наступною оцінною моделлю може бути.

введіть тут опис зображення

Врожайність

введіть тут опис зображення

введіть тут опис зображення

введіть тут опис зображення введіть тут опис зображення введіть тут опис зображення Потім можна видалити несуттєву константу і отримати вдосконалену модель: введіть тут опис зображення

Зауважимо, що для отримання набору залишків, які мають постійну дисперсію, не потрібно було жодних силових перетворень. Зауважте, що прогнози не є вибуховими.

введіть тут опис зображення

введіть тут опис зображення

З точки зору простої зваженої суми маємо: 13 ваг; 3 не нульовий і дорівнює (1.0.1,0., - 1.0)

введіть тут опис зображення

введіть тут опис зображення

Цей матеріал був представлений таким чином, що був неавтоматичним і, як наслідок, необхідною взаємодією користувачів з точки зору прийняття модельних рішень.


Привіт IrishStat, я знову. Мені сподобався ваш обширний приклад, але є два уривки, які є дещо незрозумілими (принаймні для мене): "Автокореляція цієї серії помилково вказує на те, що" все добре "і може виникнути потреба в будь-якій корекції Ma (1) "та" Цей ACF дозволяє припустити до моделі потенційно два коефіцієнти ковзних середніх ". Що саме ви бачите в тих сюжетах АСУ, що змушує вас повірити в це? Вони не виглядають нормально (майже всі значення знаходяться в межах "синіх ліній")?
Брюдер

: VBruder Я думаю, що я "помилявся" із твердженням "може бути ....." У другому прикладі є докази "поганого ACF" на lag1 та lag 12, що говорить про потенційну потребу в коефіцієнтах t2o ma. . Ви переконуєте ці межі, оскільки boyh the acf91) та acf (12) "небезпечно близькі". Ви можете зв’язатися зі мною безпосередньо на мою опубліковану електронну адресу, доступну з моєї інформації.
IrishStat

Приємно написати. "Модель ARIMA, що відображає коригування для трьох незвичайних точок даних" Ви говорите, що для цих трьох точок ви додали три змінних змінних? З точки зору неспеціалістів, як враховуються ці три чужі люди в майбутньому прогнозі? (Я впевнений, що це просто, я просто не знайомий з цим.) Крім того, схоже, що ваші межі помилок не збільшуються з часом. (А може, пов'язана помилка залежить від модальності кроку?) Дякую заздалегідь.
Адам

@Adam, три фіктивних змінних не грають ніякої ролі в прогнозуванні, оскільки майбутні значення дорівнюють 0. Так, представлені межі помилок невірні. Ми вирішили цей недолік, і тепер AUTOBOX представляє зростаючі межі помилок із часом. Я один із розробників AUTOBOX. .
IrishStat

@IrishStat "три змінних манекена не грають ніякої ролі в прогнозуванні, оскільки майбутні значення дорівнюють 0." Чи це по суті означає, що вони витягнуті з даних? Вони повинні мати певний вплив на межі прогнозування?
Адам

15

Я спробував це зробити в 7-му розділі мого підручника 1998 року з Makridakis & Wheelwright. Чи вдалося мені це чи ні, я залишу інших судити. Деякі глави ви можете прочитати в Інтернеті через Amazon (з p311). Шукайте "ARIMA" у книзі, щоб переконати Amazon показати вам відповідні сторінки.

Оновлення: У мене нова книга, яка є безкоштовною та в Інтернеті. Розділ ARIMA знаходиться тут .


3

Я б рекомендував прогнозувати за допомогою Univariate Box - моделі Jenkins: поняття та випадки Алана Панкраца. Ця класична книга має всі функції, про які ви просили:

  • використовує мінімальну математику
  • розширює дискусію поза побудовою моделі на використання цієї моделі для прогнозування конкретних випадків
  • використовує графіку, а також числові результати для характеристики відповідності між прогнозованими та фактичними значеннями.

Єдиним недоліком є ​​те, що він був надрукований у 1983 році і, можливо, не має останніх подій. У січні 2014 року видавець виходить з другою редакцією з оновленнями.


Я також порекомендував би іншу книгу Алана Панкраца: Прогнозування за допомогою моделей динамічної регресії. Дуже схожий матеріал, але покриває трохи більше землі; хоча і менш детально про сторону речей Box-Jenkins. Приємно чути, що у січні 2014 року вийде друге видання!
Graeme Walsh

-4

Модель ARIMA - це просто середньозважений показник. Він відповідає на подвійне запитання;

  1. Скільки періоду (k) потрібно використати для обчислення середньозваженого

і

  1. Точно, які ваги k

Він відповідає дівочій молитві, щоб визначити, як пристосуватися до попередніх значень (і попередніх значень ТАКІ), щоб спроектувати серію (яка насправді викликана невизначеними причинними змінними). ​​Таким чином, модель ARIMA є причинною моделлю бідної людини.


-1 Ця відповідь не відповідає на запитання, яке шукає "добре пояснений ... * приклад *".
whuber

@whuber: ОП попросила відповідь, що "використовується мінімальна математика". Моя відповідь детально розписала мінімальну математику і мотивувалась пояснювати моделі ARIMA звичайними повсякденними словами. Це ніколи не робиться, оскільки хлопці з теорії математики зосереджуються на "поясненні високого класу", використовуючи поліном, оператори розрізнення, нелінійну оптимізацію тощо.
IrishStat

@Irish Я погоджуюся з мотивацією стримувати математику, особливо за запитом користувача. Але ця відповідь, схоже, відповідає на інше запитання: "що таке АРІМА". Конкретний характер оригінального питання також вказує на те, що ОП має гарне уявлення про те, що таке ARIMA і для чого це добре; вони хочуть бачити це в дії. Б'юсь об заклад, що ви легко можете внести такий тематичний приклад :-).
whuber

: whuber: Це було б мені дуже просто, і я можу просто це зробити.
IrishStat

@Irish Я з нетерпінням чекаю його. Більше того - це питання не виникало тут, але воно виникло і в інших місцях - такі внески потенційно є більш потужними та більш оціненими способами давати людям знати, що ви можете зробити, ніж багато інших явних форм маркетингу.
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.