Auto.arima vs autobox Чи відрізняються вони?


16

З читання публікацій на цьому сайті я знаю, що є функція R auto.arimaforecast пакеті ). Я також знаю, що IrishStat , учасник цього сайту, побудував комерційний пакет autobox на початку 1980-х. Оскільки ці два пакети існують сьогодні і автоматично вибирають моделі arima для даних наборів даних, що вони роблять по-різному? Чи можуть вони виробляти різні моделі для одного і того ж набору даних?


Дякуємо за редагування @Wayne. Я не знайомий з пакетом прогнозу R, але я впевнений, що саме я маю на увазі порівняння з автобоком.
Майкл Р. Черник

(Я щойно зробив другу невелику зміну "auto-arima" на "auto.arima".) Можливо auto.arima, в інших пакунках є інші функції, але напевно є одна в forecast, опис якої: "Повертає найкращу модель ARIMA відповідно до значень AIC, AICc або BIC. Функція проводить пошук можливої ​​моделі в межах наданих обмежень порядку. "
Уейн

1
AUTOBOX трактує автоматичну ідентифікацію цілісним шляхом, повторюючи автоматичну ідентифікацію, фактично оцінюючи, а потім виконуючи діагностичні покрокові та покрокові процедури для надання моделі, яка має лише статистично значущі параметри, в той час як процес помилки не містить ідентифікуючої структури . Таким чином слід за сценарієм ітерації. Ранні версії AUTOBOX близько 1975 р. Намагалися використати "єдиний статистичний підхід", але це було виявлено, що вони бажали, щоб ідентифіковані моделі мали надлишкову або нерозумну структуру (наприклад, 5,1,2) або очевидно недостатню структуру.
IrishStat

1
@IrishStat Це звучить як хороший підхід. Що ви робите, якщо знайдете дві конкуруючі моделі, які відповідають вашим вимогам. Це здається можливим. Чи рекомендуєте ви "оптимальну" модель на основі конкретних критеріїв? Я усвідомлюю, що вибір моделі, що має лише "статистично значущі параметри", може сприяти парсимуванню, але не можливо мати процес AR низького параметра та іншу модель AEMA низького порядку, де всі параметри є статистично значущими, а залишки виглядають білими шум?
Майкл Р. Черник

1
@IriehStat. Я погоджуюсь з тобою. Зрештою, що ви робите для користувача. Ви надаєте лише одну модель або можете подати упорядкований список конкуруючих прийнятних моделей? Якщо не остання, можливо, це було б хорошим варіантом додати там, де ви обмежите список невеликою кількістю.
Майкл Р. Черник

Відповіді:


9

Майкл / Уейн

AUTOBOX неодмінно доставить / визначить іншу модель, якщо буде виконано одну або декілька наступних умов

1) в даних є імпульси

2) в даних є 1 або більше зрушень рівня / кроку

3) якщо в даних є сезонні імпульси

4) в даних є 1 або більше місцевих тенденцій часу, які не просто виправити

5) якщо параметри моделі з часом змінюються

6) якщо дисперсія помилок з часом змінюється і перетворення потужності не є адекватним.

З точки зору конкретного прикладу, я б запропонував вам обидва вибрати / зробити часовий ряд та опублікувати їх обох в Інтернеті. Я буду використовувати AUTOBOX для аналізу даних у режимі без нагляду, і розміщу моделі у списку. Потім ви запускаєте програму R, а потім кожен з вас робить окремий об'єктивний аналіз обох результатів, вказуючи на подібність та відмінності. Надішліть ці дві моделі в комплекті з усіма доступними допоміжними матеріалами, включаючи остаточні умови помилки, для отримання коментарів. Узагальнити та подати ці результати до списку, а потім попросити читачів списку ГОЛОСУВАТИ, яка процедура їм найкраще здається.


Ви маєте в виду конкурс , як цей ?
whuber

@whuber Так. Можливо, навіть використовуючи якийсь "невідомий / закодований приклад текстової книги", який може бути використаний як фон.
IrishStat

22

Вони представляють два різних підходи до двох подібних, але різних проблем. Я писав auto.arimaі @IrishStat є автором Autobox.

auto.arima()підходить (сезонні) моделі ARIMA, включаючи умови дрейфу. Autoboxпідходить для моделей функцій передачі для обробки змін та видатків рівня. Модель ARIMA - це особливий випадок моделі функції передачі.

Навіть якщо ви вимкнули зміщення рівня та виявлення зовнішньої форми Autobox, ви отримаєте іншу модель ARIMA auto.arima()через різні варіанти визначення ідентифікаційних параметрів ARIMA.

У моєму тестуванні даних M3 та M-конкуренції auto.arima()даються більш точні прогнози, ніж Autoboxдля цих даних. Однак, Autoboxбуде краще з даними, що містять основні атрибути та зрушення рівня.


3
Я вважаю, що ви посилалися на версію AUTOBOX ще багато-багато років тому. AUTOBOX помітно змінився ой за ці багато років. Якщо я не помиляюся, ви порівнювали лише точність 1-го походження, на яку я впевнений, що ви погодитесь, - це зразок 1. Точності потрібно оцінювати за різними джерелами.
IrishStat

15
Я маю на увазі опубліковані порівняння у тисячах серій. Як головний редактор Міжнародного журналу прогнозування, я думаю, що я маю певне уявлення про те, як оцінити прогнози.
Роб Хайндман

2
Я не збирався з цього питання виводити аргументи щодо того, хто має найкращий алгоритм прогнозування. Я думаю, що автобокс і auto.arima, ймовірно, дуже хороші пакети. Порівняння головою до голови може бути не справедливим з багатьох причин. 1) Користувач може бути недостатньо досвідченим, щоб знати, як їх судити. 2) Точність прогнозу в одному часовому ряду - це невдалий знімок. У прогнозуванні може бути нижча середня квадратична помилка, але, коли бере участь випадковість, її слід враховувати. Вам потрібно переглянути кілька серій, і як пропонує IrishStat, ви повинні подивитися на різні вихідні точки.
Майкл Р. Черник

Також різні пункти для ініціювання прогнозування були б корисні. 3) У світі ARIMA існує декілька уявлень для однієї і тієї ж моделі часових рядів, кінцеві процеси AR мають нескінченні представлення середніх ковзних і навпаки. Таким чином, AR низького порядку може бути майже таким же, як ковзний середній показник високого порядку або ARMA. Коробка завжди пропонувала керуватися принципом парсингу. Але якщо у вас багато даних, ви можете отримати хороші оцінки параметрів, і модель високого порядку може генерувати майже ті ж прогнози, що і парсимонічні. 4) Два пакети мають різні цілі.
Майкл Р. Черник

3
Метод розвивався з часом. Дейв Рейлі дуже активний на цьому сайті як IrishStat, і він дуже відкрито роз'яснював, як це працює в загальних рисах. Важливим аспектом бізнесу є наявність комерційної таємниці та фірмових алгоритмів. З його погляду R завдає шкоди своєму бізнесу так само, як це стосується SPlus. Але він не виявляє гіркоти і дуже готовий продемонструвати своє програмне забезпечення, як ви бачите, що він робив сьогодні. Він також готовий проводити тести проти конкурентів, і я вважаю, що він взяв участь у змаганнях з прогнозування часових рядів.
Майкл Р. Черник

11

EDIT: На ваш коментар, я вважаю, що якщо ви вимкнете багато autoboxваріантів, ви, ймовірно, отримаєте подібну відповідь auto.arima. Але якщо ви цього не зробите, а в присутності людей, що вижили, напевно буде різниця: auto.arimaне піклується про людей, які переживають autoboxлюди , тоді як буде їх виявляти та обробляти їх належним чином, що дасть кращу модель. Можуть бути й інші відмінності, і я впевнений, що IrishStat може їх описати.


Я вважаю, що autoboxвиявляє люди, що не впадають у життя, та інші речі, крім простого пошуку найкращих коефіцієнтів AR, I та MA. Якщо це правильно, знадобиться додатковий аналіз та пара інших функцій R, щоб мати подібну функціональність. І IrishStats є цінним членом цієї спільноти і досить доброзичливим.

Звичайно, R безкоштовна і може робити багато мільйонів речей за межами ARIMA.

Ще один вибір, який є безкоштовним для економічного стилю ARIMA, - X13-ARIMA SEATSз Бюро перепису населення США, яке є відкритим кодом. Є бінарні файли для Windows та Linux, але вони складені прямо на моєму Mac, враховуючи, що я вже завантажив компілятор gfortran gfortran. Це спадкоємець X12-ARIMAі був випущений за останні кілька днів, після років розробки та тестування. (Він оновлює X12, а також додає функції SEATS / TRAMO. X12 - офіційний інструмент США, тоді як SEATS / TRAMO - з Банку Іспанії та є "європейським інструментом".)

Мені дуже подобається X12 (а зараз X13). Якщо ви виведете неабияку кількість діагностики і прочитаєте їх і дізнаєтеся, що вони означають, вони насправді є досить хорошою освітою в ARIMA та часових рядах. Я розробив власний робочий процес, але є пакет R x12для виконання більшості робіт зсередини R (все одно потрібно створити файл вхідної моделі (".spc") для X12).

Я кажу, що X12 добре підходить до ARIMA в "стилі економіки", щоб мати на увазі щомісячні дані, що мають більше 3 років даних. (Для використання деяких діагностичних функцій вам потрібно 5 років). Він має функцію зовнішньої ідентифікації, може обробляти всі види специфікацій зовнішньої торгівлі, а також обробляти свята, плаваючі відпустки, ефекти торгових днів та безліч економічних речей. Це інструмент, який використовується урядом США для створення сезонно коригуваних даних.


Моє запитання справді отримало набір даних, чи можливо два алгоритми дадуть різні варіанти вибору моделі. Мені цікаво справді автоматичне функціонування, а не будь-які інші діагностичні особливості, що один може вважати, що інший ні. Відомо, що сімейство моделей ARMA та дві моделі в сім'ї можуть бути точними або майже точними альтернативними уявленнями тієї ж моделі. Отже, якщо є невеликі відмінності у процедурі відбору, я думаю, що вони можуть дати різні варіанти моделей.
Майкл Р. Черник

3
@MichaelChernick: Ага. Я думаю, що якщо ви вимкнете всі автоматичні матеріали, autoboxви отримаєте ту саму відповідь. Але один із моментів використання autobox- це те, що він виявить людей, що не впадають у рух, і оброблятимуть їх як такі, тому модель, що повертається, була б іншою, якщо є люди, що існують.
Уейн

@Wayne +1 для отримання додаткової інформації про сидіння X13-ARIMA та SEATS / TRAMO.
Graeme Walsh

@Wayne До речі, ще один "Європейський інструмент" DEMETRA + .
Graeme Walsh
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.