Навіщо використовувати певний показник помилки прогнозу (наприклад, MAD) на відміну від іншого (наприклад, MSE)?


15

MAD = Середнє абсолютне відхилення MSE = Середня помилка квадрата

Я бачив пропозиції з різних місць, що MSE використовується, незважаючи на деякі небажані якості (наприклад, http://www.stat.nus.edu.sg/~staxyc/T12.pdf , де зазначено на сторінці p8 "Поширена думка, що MAD є кращим критерієм, ніж MSE. Однак математично MSE зручніше, ніж MAD. ")

Чи є в цьому більше, ніж це? Чи є документ, який детально аналізує ситуації, в яких різні методи вимірювання похибки прогнозу є більш / менш підходящими? Мій пошук у Google нічого не виявив.

Аналогічне запитання було задано на веб- сайті /programming/13391376/how-to-decide-the-forecasting-method-from-the-me-mad-mse-sde , і користувачеві було запропоновано публікація на stats.stackexchange.com, але я не думаю, що вони ніколи цього робили.


2
MAD , як правило , медіана Абсолютне відхилення , а не маю в виду, ні?
Брайан Д

@BrianD: у широкій статистичній спільноті ви маєте рацію. У більш вузькому співтоваристві з прогнозуванням "MAD" незмінно є "середнім абсолютним відхиленням", AKA MAE .
Стефан Коласа

Відповіді:


23

Щоб вирішити, яку точку помилки прогнозування використовувати, нам потрібно зробити крок назад. Зауважте, що майбутні результати ми не знаємо досконало, і ніколи не будемо. Тож майбутній результат слід за розподілом ймовірності . Деякі методи прогнозування явно видають таке повне розповсюдження, а деякі - ні, але воно завжди є, якщо тільки неявно.

Тепер ми хочемо мати хороший показник помилок для точкового прогнозу . Такий точковий прогноз Ft - це наша спроба узагальнити те, що ми знаємо про майбутній розподіл (тобто прогнозний розподіл) за час t використовуючи єдине число, так званий функціонал майбутньої щільності. Тоді міра помилок - це спосіб оцінити якість цього підсумкового числа.

Таким чином, ви повинні вибрати міру помилки, яка приносить користь "хорошим" підсумкам одного числа (невідомих, можливо прогнозованих, але можливо лише неявних) майбутніх густин.

Завдання полягає в тому, що різні заходи помилок мінімізуються різними функціоналами. Очікувана MSE мінімізується на очікувану величину майбутнього розподілу. Очікувана MAD мінімізується на медіаною майбутнього розподілу. Таким чином, якщо ви відкалібруєте свої прогнози, щоб мінімізувати рівень MAE, ваш точковий прогноз буде майбутньою медіаною, а не майбутнім очікуваним значенням, і ваші прогнози будуть упередженими, якщо ваш майбутній розподіл не буде симетричним.

Це найбільш актуально для даних підрахунку, які зазвичай перекошені. У крайніх випадках (скажімо, Пуассон розподіляв продажі із середнім показником нижче log20.69 ), ваш MAE буде найнижчим для прогнозу рівного нуля. Детальніше дивіться тут або тут або тут .

Я надаю ще додаткову інформацію та ілюстрацію в частині Які недоліки Помилки середнього абсолютного відсотка (MAPE)? Цей потік враховує , але також інші заходи помилок, і він містить посилання на інші пов'язані потоки.


Зрештою, яку міру помилок використовувати насправді, залежить від вашої вартості помилки прогнозу, тобто від того, який тип помилки найбільш болючий. Не дивлячись на реальні наслідки прогнозних помилок, будь-яке обговорення "кращих критеріїв" в основному безглуздо.

Заходи точності прогнозу були великою темою у спільноті з прогнозуванням кілька років тому, і вони все ще з’являються раз у раз. Однією з дуже хороших статей, на яку слід звернути увагу, є Hyndman & Koehler "Ще один погляд на заходи точності прогнозу" (2006).

Нарешті, однією з альтернатив є обчислення повної прогнозної щільності та оцінка їх за допомогою правильних .


Дякуємо за відповідь та посилання. Я не був знайомий з терміном "Вартість помилки прогнозу". Схоже, це стосується ситуацій, коли (наприклад, бізнес прогнозує, скільки віджетів продасть, і, можливо, біль, який вони зазнають за завищення, вдвічі більший, ніж біль, який вони зазнають за недооцінку. Однак я, головним чином, думаю про контекст, в якому миряни роблять прогнози, не маючи очевидних помилок прогнозування (наприклад, «скільки твітів зробить Білл Гейтс у найближчі 5 місяців?»). Чи в такій ситуації мій вибір помилки буде довільним?
user1205901

3
Про помилку прогнозування було обговорено в журналі, орієнтованому на практику, передбачення : forecasters.org/foresight Дуже рекомендується! (Повне розкриття інформації: я асоційований редактор.) Я погоджуюся, що CoFE не є очевидним у вашому прикладі, але тоді мені було б цікаво, скільки зусиль ви повинні реально витратити на оптимізацію міри помилок ...
Стефан Коласа

4

Переваги використання MAE замість MSE пояснюються у « Давиденко та Фільдес» (2016) , див. Розділ 3.1:

... Деякі автори (наприклад, Zellner, 1986) стверджують, що критерій, за яким ми оцінюємо прогнози, повинен відповідати критерію, за яким ми оптимізуємо прогнози. Іншими словами, якщо ми оптимізуємо оцінки, використовуючи деяку задану функцію втрат, ми повинні використовувати ту саму функцію втрат для емпіричного оцінювання, щоб з'ясувати, яка модель є кращою.

Встановлення статистичної моделі зазвичай дає прогнози, оптимальні при квадратичних втратах. Це, наприклад, відбувається, коли ми підходимо до лінійної регресії. Якщо наш прогноз щільності при статистичному моделюванні симетричний, то оптимальні прогнози при квадратичних втратах також оптимальні при лінійних втратах. Але, якщо ми стабілізуємо дисперсію за допомогою log-перетворень, а потім перетворимо прогнози назад за експоненціацією, ми отримаємо прогнози, оптимальні лише за лінійних втрат. Якщо ми використовуємо іншу втрату, ми повинні спочатку отримати прогноз щільності за допомогою статистичної моделі, а потім скорегувати нашу оцінку, враховуючи нашу конкретну функцію втрат (див. Приклади цього в Goodwin, 2000).

Припустимо, ми хочемо емпірично порівняти два методи та з’ясувати, який метод кращий з точки зору симетричної лінійної втрати (оскільки цей тип втрат зазвичай використовується в моделюванні). Якщо у нас є лише один часовий ряд, здається природним використовувати середню абсолютну помилку (МАЕ). Крім того, MAE привабливий тим, що його легко зрозуміти та обчислити (Hyndman, 2006) ...

Список літератури

Давиденко, А., & Фільдес, Р. (2016). Заходи помилок прогнозування: критичний огляд та практичні рекомендації. У бізнес-прогнозуванні: практичні проблеми та рішення. Джон Вілі та сини


Чи можете ви дати повну цитату до газети, а не просто "Давиденко і Фільдес, 2016"?
Срібна рибка

Нам подобається, що наші відповіді мають бути самостійними, щоб на них не впливали негативні зв’язки. Як ви вважаєте, ви могли дещо розширити свою відповідь, щоб узагальнити те, що, на вашу думку, були ключовими пунктами її змісту, що мають відношення до цього питання? В іншому випадку це дійсно більше підходить для коментаря, ніж відповіді. (Я вдячний, що у вас поки що недостатньо репутації для публікації коментарів, але ми можемо перетворити їх на один для вас.)
Silverfish

1
Спасибі за Вашу відповідь! Ось що говорить (Давиденко та Фільдес, 2016): Встановлення статистичної моделі зазвичай дає оптимальні прогнози при квадратичних втратах. Це, наприклад, відбувається, коли ми підходимо до лінійної регресії. Якщо наш прогноз щільності при статистичному моделюванні симетричний, то оптимальні прогнози при квадратичних втратах також оптимальні при лінійних втратах. Але, якщо ми стабілізуємо дисперсію за допомогою log-перетворень, а потім перетворимо прогнози назад за експоненціацією, ми отримаємо прогнози, оптимальні лише за лінійних втрат.
Turbofly

1
Спасибі! Ви можете відредагувати цю інформацію у своїй відповіді (кнопка "редагувати" знаходиться внизу вашої публікації).
Срібна рибка

Дуже дякую. Я зробив деякі форматування і дав повне цитування.
Срібна рибка

3

RМSЕ=МSЕМАЕ=МАD

Насправді,

МАЕRМSЕнМАЕ

  • е
    RМSЕ=1неi2=1нне2=е=МАЕ
  • верхня межа: один випадок, що має помилку е а всі інші випадки мають 0 помилок:
    МАЕ=ен
    RМSЕ=1неi2=1не2=1н(нМАЕ)2=нМАЕ

(МАЕRМSЕМАЕ для класифікації з частковим класом уi та / або у^i є [0,1] - тобто вони можуть насправді приймати значення між 0 і 1).

  • верхня межа: тут, еi є 1, так
    МАЕ=ншrонгн
    RМSЕ=1неi2=1нншrонг=МАЕ
    (Ця верхня межа зустрічається для цілого числа ншrонг, якщо ви йдете на часткове / часткове членство в класі, а отже, і на еi[0,1], справи стають дещо складнішими, оскільки потрібно враховувати, що максимально можлива помилка може бути меншою за 1, і у вас може бути "залишок" еi<1 які обидві опускають верхню межу трохи далі.)

Якщо RMSE близький до MAE, у вас є багато невеликих відхилень, якщо він близький до його верхньої межі, є мало грубо неправильних прогнозів.


Ви маєте на увазі sqrt (n) * MAE або sqrt (n * MAE) як верхню межу?
Кріс

1
@Chris: це sqrt (n) * MAE, дивіться мою редагування.
cbeleites підтримує Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.