Інтерпретація середньої абсолютної помилки (MASE)


22

Середня абсолютна масштабована помилка (MASE) - це міра точності прогнозування, запропонована Koehler & Hyndman (2006) .

МАSЕ=МАЕМАЕiн-самpле,наivе

де - середня абсолютна похибка, вироблена фактичним прогнозом; тоді як - середня абсолютна похибка, що створюється наївним прогнозом (наприклад, прогноз без змін інтегрованого часового ряду), обчислена на даних вибірки.M A E i n - s a m p l e ,МАЕ
I(1)МАЕiн-самpле,наivеЯ(1)

(Ознайомтеся з документом Koehler & Hyndman (2006) для точного визначення та формули.)

M A S E > 1МАSЕ>1 означає, що фактичний прогноз виходить гіршим за вибірку, ніж наївний прогноз у вибірці, з точки зору середньої абсолютної помилки. Таким чином, якщо середня абсолютна похибка є відповідним показником точності прогнозування (що залежить від проблеми, яка існує), припускає, що фактичний прогноз слід відкинути на користь наївного прогнозу, якщо ми очікуємо, що вибірні дані не будуть бути цілком схожими на вибіркові дані (адже ми знаємо лише, наскільки наївний прогноз виконаний у вибірці, а не поза вибіркою)МАSЕ>1

Питання:

МАSЕ=1,38 було використано як орієнтир у змаганнях з прогнозування, запропонованих у цій публікації блогу Hyndsight . Чи не повинен був очевидним орієнтиром бути ?МАSЕ=1

Звичайно, це питання не стосується конкретної конкуренції з прогнозування. Я хотів би допомогти в розумінні цього в більш загальному контексті.

Моя здогадка:

Єдине розумне пояснення, яке я бачу, - це те, що, як очікувалося, наївний прогноз буде набагато гіршим, ніж у вибірці, наприклад, через структурні зміни. Тоді можливо, було занадто складним для досягнення.МАSЕ<1

Список літератури:


У своєму дописі на блозі Роб зазначає, звідки походить цей орієнтир: "Ці порогові показники є найбільш ефективними методами аналізу цих даних, описаних в Athanasopoulos et al (2010)". Ви подивилися на папір Athanosopoulos?
S. Kolassa - Відновіть Моніку

Мене трохи спантеличує "Ваша здогадка": структурна зміна означатиме, що складний прогноз буде базуватися на частково нерелевантних минулих даних. Але як структурний перелом вплине на прогноз "без змін", залежить від перерви. Якщо, наприклад , ми дивимося на блукання зі зносом та структурних засобів зламу , що дрейф, член постійної, тільки що отримав нижче , то прогноз «без змін» буде працювати краще після перерви, ніж до неї.
Алекос Пападопулос

МАSЕ>>1

МАSЕ

Відповіді:


15

У пов’язаному дописі на блозі Роб Хайндман закликає участі у конкурсі з прогнозування туризму. По суті, повідомлення в блозі слугує для привернення уваги до відповідної статті IJF , необ’єднана версія якої пов'язана з публікацією в блозі.

Орієнтовні показники, на які ви посилаєтесь - 1,38 за місяць, 1,43 за квартальні та 2,28 за річні дані, - очевидно, були досягнуті наступним чином. Автори (всі вони є експертами з прогнозування та дуже активні в IIF - тут немає продавців зміїної олії) цілком здатні застосовувати стандартні алгоритми прогнозування або програмне забезпечення для прогнозування, і їх, мабуть, не цікавить просте подання ARIMA. Тому вони пішли і застосували до своїх даних деякі стандартні методи. Для того, щоб виграш подали заявку на роботу в IJF , вони просять, щоб він покращився на кращому рівні з цих стандартних методів, що вимірюються MASE.

Отже, ваше питання зводиться до:

Зважаючи на те, що MASE 1 відповідає прогнозу, який є вибірковим настільки ж хорошим (за MAD), як і наївний прогноз випадкового ходу у вибірці, чому стандартні методи прогнозування, такі як ARIMA, не можуть покращитись на 1,38 для щомісячних даних?

Тут, 1,38 МАСЕ походить із таблиці 4 у неоднорідній версії. Це середній показник ASE за прогноз ARIMA на 1-24 місяці вперед. Інші стандартні методи, такі як прогноз Proro, ETS тощо, працюють навіть гірше.

досвід(т)зі стандартними методами. Жодне з них не охопить тенденцію, що прискорюється (і це, як правило, хороша річ - якщо ваш алгоритм прогнозування часто моделює прискорюючий тренд, ви, швидше за все, набагато перевищить свою оцінку), і вони дадуть МАСЕ вище 1. Інші пояснення можуть як ви говорите, це різні структурні розриви, наприклад, зміна рівня або зовнішні впливи, такі як SARS або 9/11, які не будуть охоплені непричинними моделями орієнтиру, але які можуть бути змодельовані спеціальними методами прогнозування туризму (хоча використовуючи майбутні каузали у зразку тримання - це своєрідний обман).

Тому я б сказав, що ви, швидше за все, не можете сказати багато про це, не дивлячись на самі дані. Вони доступні на Kaggle. Ваша найкраща ставка, ймовірно, візьме ці серії 518, витримає останні 24 місяці, підходить серія ARIMA, підрахує MASE, вирийте десять-двадцять найгірших прогнозних серій, отримайте великий горщик кави, подивіться ці серії та спробуйте щоб з'ясувати, що саме робить ARIMA моделями настільки поганими при їх прогнозуванні.

EDIT: ще один момент, який здається очевидним після цього факту, але мені знадобилося п’ять днів - пам’ятайте, що знаменник MASE - це крок вперед у вибірці прогнозу випадкового ходу, тоді як чисельник - це середній показник 1-24- крок вперед прогнози. Не надто дивно, що прогнози погіршуються зі збільшенням горизонтів, тому це може бути ще однією причиною MASE 1,38. Зауважимо, що прогноз сезонного наїву також був включений у орієнтир і мав ще більший MASE.


Чудова відповідь! Дякуємо за стислий підсумок оригіналу документа (він буде корисним ярликом для всіх непосвячених). Здається, головна ідея вашої відповіді не суперечить моїй здогадці (а навпаки, поширює її); Вибірка має щось особливе, що недооцінює помилку наївного прогнозу у вибірці.
Річард Харді

2

Не відповідь, а сюжет після заклику Стефана Коласи "переглянути ці серії".
Kaggle tourism1 має 518 річних часових рядів, для яких ми хочемо передбачити останні 4 значення:

введіть тут опис зображення

5тгод
Еrrоr4(у)14ласт 4|уi-у-5|
Еrrоr4(у)ленгтгод(у)

Очевидно, дуже короткі серії - 12 11 7 7 7 ... у верхньому ряду - важко передбачити: не сюрприз.
(Athanasopoulos, Hyndman, Song and W; Конкурс прогнозування туризму (2011, 23 р.) Використовував 112 із 518 річних серій, але я не бачу, які з них.)

Чи є інші, новіші колекції часових рядів з 2010 року, які, можливо, варто переглянути?


Спасибі! Я не знаю відповіді на ваше останнє запитання.
Річард Харді

1
@denis: щойно побачила ваше запитання - ви можете запитати дані на OpenData.SE .
S. Kolassa - Відновіть Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.