Які недоліки середньої абсолютної процентної помилки (MAPE)?


29

Відсоток помилки Середнього Absolute ( ) є спільною точністю або міра помилки для часових рядів або інших передбачень,

MAPE=100nt=1n|AtFt|At%,

де - фактичні факти, а F t - відповідні прогнози чи прогнози.AtFt

MAPE - це відсоток, тому ми можемо легко порівняти його між серіями, а люди можуть легко зрозуміти та інтерпретувати відсотки.

Однак я чую, що у MAPE є недоліки. Я б хотів краще зрозуміти ці недоліки, щоб я міг прийняти обгрунтоване рішення про те, чи використовувати MAPE або якусь альтернативу, наприклад, MSE ( ), MAE ( ) або MASE ( ).

Відповіді:


45

Недоліки MAPE

  • MAPE у відсотках має сенс лише для значень, де поділи та співвідношення мають сенс. Наприклад, не має сенсу обчислювати відсотки температур, тому не слід використовувати MAPE для обчислення точності прогнозу температури.

  • At=0

    Ft=100Ft=1000

    Якщо трапляється лише кілька нулів, ви можете використовувати зважений MAPE ( Kolassa & Schütz, 2007 ), який, тим не менш, має власні проблеми. Це стосується і симетричного MAPE ( Goodwin & Lawton, 1999 ).

  • MAPE можуть перевищувати 100%. Якщо ви віддаєте перевагу роботі з точністю, яку деякі люди визначають як 100% -МАРТ, це може призвести до негативної точності, яку люди можуть важко зрозуміти. ( Ні, точність обрізання нуля - це не дуже гарна ідея. )

  • Ft=0At=1Ft=5At=1

Особливо остання точка кулі заслуговує трохи більше думки. Для цього нам потрібно зробити крок назад.

Fttt=1,,n

Проблема тут полягає в тому, що люди рідко відверто кажуть, що таке хороший підсумок майбутнього розповсюдження.

FtFt

Ось проблема: мінімізація MAPE, як правило, не стимулює нас до отримання цього очікування, а зовсім інший підсумок з одним числом ( McKenzie, 2011 , Kolassa, 2020 ). Це відбувається з двох різних причин.

  • (μ=1,σ2=1)

    лонормальний

    Горизонтальні лінії дають оптимальні точкові прогнози, де "оптимальність" визначається як мінімізація очікуваної помилки для різних заходів помилок.

    • Ft=exp(μ+σ22)4.5
    • Ft=expμ2.7
    • Ft=exp(μσ2)=1.0β=1

    Ми бачимо, що асиметрія майбутнього розподілу, а також той факт, що MAPE по-різному карає завищені та недооцінені, означає, що мінімізація MAPE призведе до сильно упереджених прогнозів. ( Ось розрахунок оптимальних точкових прогнозів у випадку гамми. )

  • Att

    рулон

    В цьому випадку:

    • Ft=3.5

    • 3Ft4

    • Ft=2

    Ми знову бачимо, як мінімізація MAPE може призвести до упередженого прогнозу через різницю покарання, що застосовується до переоцінки та недооцінки. У цьому випадку проблема виходить не з асиметричного розподілу, а з високого коефіцієнта варіації нашого процесу генерації даних.

    Це насправді проста ілюстрація, яку ви можете використовувати, щоб навчити людей про недоліки КАРТИ - просто вручіть своїм відвідувачам кілька кубиків і згорніть їх. Дивіться інформацію про Kolassa & Martin (2011) для отримання додаткової інформації.

Пов’язані питання CrossValidated

R код

Приклад логіки:

mm <- 1
ss.sq <- 1
SAPMediumGray <- "#999999"; SAPGold <- "#F0AB00"

set.seed(2013)
actuals <- rlnorm(100,meanlog=mm,sdlog=sqrt(ss.sq))

opar <- par(mar=c(3,2,0,0)+.1)
    plot(actuals,type="o",pch=21,cex=0.8,bg="black",xlab="",ylab="",xlim=c(0,150))
    abline(v=101,col=SAPMediumGray)

    xx <- seq(0,max(actuals),by=.1)
    polygon(c(101+150*dlnorm(xx,meanlog=mm,sdlog=sqrt(ss.sq)),
      rep(101,length(xx))),c(xx,rev(xx)),col="lightgray",border=NA)

    (min.Ese <- exp(mm+ss.sq/2))
    lines(c(101,150),rep(min.Ese,2),col=SAPGold,lwd=3,lty=2)

    (min.Eae <- exp(mm))
    lines(c(101,150),rep(min.Eae,2),col=SAPGold,lwd=3,lty=3)

    (min.Eape <- exp(mm-ss.sq))
    lines(c(101,150),rep(min.Eape,2),col=SAPGold,lwd=3,lty=4)
par(opar)

Приклад прокатки кісток:

SAPMediumGray <- "#999999"; SAPGold <- "#F0AB00"

set.seed(2013)
actuals <- sample(x=1:6,size=100,replace=TRUE)

opar <- par(mar=c(3,2,0,0)+.1)
    plot(actuals,type="o",pch=21,cex=0.8,bg="black",xlab="",ylab="",xlim=c(0,150))
    abline(v=101,col=SAPMediumGray)

    min.Ese <- 3.5
    lines(c(101,150),rep(min.Ese,2),col=SAPGold,lwd=3,lty=2)

    min.Eape <- 2
    lines(c(101,150),rep(min.Eape,2),col=SAPGold,lwd=3,lty=4)
par(opar)

Список літератури

Гнайтінг, Т. Складання та оцінка точкових прогнозів . Журнал Американської статистичної асоціації , 2011, 106, 746-762

Гудвін, П. та Лоутон, Р. Про асиметрію симетричного MAPE . Міжнародний журнал прогнозування , 1999, 15, 405-408

Гувер, Дж. Вимірювання точності прогнозу: пропуски в сьогоднішніх двигунах прогнозування та програмному плануванні попиту . Передбачення: Міжнародний журнал прикладного прогнозування , 2006, 4, 32-35

Коласса, С. Чому прогноз "найкращого" пункту залежить від міри помилки чи точності (Запрошений коментар до змагань з прогнозування М4). Міжнародний журнал прогнозування , 2020, 36 (1), 208-211

Коласа, С. та Мартін, Р. Відсотки помилок можуть зіпсувати ваш день (і прокатка кісток показує, як) . Передбачення: Міжнародний журнал прикладного прогнозування, 2011, 23, 21-29

Kolassa, S. & Schütz, W. Переваги співвідношення MAD / середнє значення щодо MAPE . Передбачення: Міжнародний журнал прикладного прогнозування , 2007, 6, 40-43

Маккензі, Дж. Середній абсолютний відсотковий похибку та упередженість в економічному прогнозуванні . Економічні листи , 2011, 113, 259-262


4
Відмінні питання та відповіді. Додам, що всі ці показники мають два основні припущення - серія є ідіальною та нерухомою. Якщо одне або обидва ці припущення не виконуються, що часто трапляється на практиці, то їх обгрунтованість сумнівна.
Майк Хантер

Я згоден з більшою частиною цього, однак, чи не було б законним мати справу з співвідношеннями температур до тих пір, поки вони знаходяться в належному масштабі (тобто, за шкалою Кельвіна)?
Відновіть Моніку

2
@Ben: у такому випадку ми не поділимо на нуль. Однак асиметрія все ще є незначною проблемою. Якщо ваш прогноз становить 293 К, а фактичний - 288 К, у вас APE становить 1,74%, а якщо прогноз - 288 К, а фактичний - 293 К, APE - 1,71%, тож другий прогноз виглядає краще, хоча обидва відключені на 5 К . (Перекладіть на C або F за потребою.) По суті, однакові абсолютні помилки караються сильніше за нижчі фактичні показники. Плюс тлумачення відсоткових помилок для температур непросте.
С. Коласа - Відновіть Моніку

1
@Ben Відсотки абсолютної температури є законними, але різницю температур легше зрозуміти - принаймні, коли ми маємо справу з температурами в повсякденному діапазоні; при прогнозуванні температури ядра зірки це може бути інакше.
Пере,
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.