Недоліки MAPE
MAPE у відсотках має сенс лише для значень, де поділи та співвідношення мають сенс. Наприклад, не має сенсу обчислювати відсотки температур, тому не слід використовувати MAPE для обчислення точності прогнозу температури.
Ат= 0
Жт= 100Жт= 1000
Якщо трапляється лише кілька нулів, ви можете використовувати зважений MAPE ( Kolassa & Schütz, 2007 ), який, тим не менш, має власні проблеми. Це стосується і симетричного MAPE ( Goodwin & Lawton, 1999 ).
MAPE можуть перевищувати 100%. Якщо ви віддаєте перевагу роботі з точністю, яку деякі люди визначають як 100% -МАРТ, це може призвести до негативної точності, яку люди можуть важко зрозуміти. ( Ні, точність обрізання нуля - це не дуже гарна ідея. )
Жт= 0Ат= 1Жт= 5Ат= 1
Особливо остання точка кулі заслуговує трохи більше думки. Для цього нам потрібно зробити крок назад.
Fttt=1,…,n
Проблема тут полягає в тому, що люди рідко відверто кажуть, що таке хороший підсумок майбутнього розповсюдження.
FtFt
Ось проблема: мінімізація MAPE, як правило, не стимулює нас до отримання цього очікування, а зовсім інший підсумок з одним числом ( McKenzie, 2011 , Kolassa, 2020 ). Це відбувається з двох різних причин.
(μ=1,σ2=1)
Горизонтальні лінії дають оптимальні точкові прогнози, де "оптимальність" визначається як мінімізація очікуваної помилки для різних заходів помилок.
- Ft=exp(μ+σ22)≈4.5
- Ft=expμ≈2.7
- Ft=exp(μ−σ2)=1.0β=−1
Ми бачимо, що асиметрія майбутнього розподілу, а також той факт, що MAPE по-різному карає завищені та недооцінені, означає, що мінімізація MAPE призведе до сильно упереджених прогнозів. ( Ось розрахунок оптимальних точкових прогнозів у випадку гамми. )
Att
В цьому випадку:
Ft=3.5
3≤Ft≤4
Ft=2
Ми знову бачимо, як мінімізація MAPE може призвести до упередженого прогнозу через різницю покарання, що застосовується до переоцінки та недооцінки. У цьому випадку проблема виходить не з асиметричного розподілу, а з високого коефіцієнта варіації нашого процесу генерації даних.
Це насправді проста ілюстрація, яку ви можете використовувати, щоб навчити людей про недоліки КАРТИ - просто вручіть своїм відвідувачам кілька кубиків і згорніть їх. Дивіться інформацію про Kolassa & Martin (2011) для отримання додаткової інформації.
Пов’язані питання CrossValidated
R код
Приклад логіки:
mm <- 1
ss.sq <- 1
SAPMediumGray <- "#999999"; SAPGold <- "#F0AB00"
set.seed(2013)
actuals <- rlnorm(100,meanlog=mm,sdlog=sqrt(ss.sq))
opar <- par(mar=c(3,2,0,0)+.1)
plot(actuals,type="o",pch=21,cex=0.8,bg="black",xlab="",ylab="",xlim=c(0,150))
abline(v=101,col=SAPMediumGray)
xx <- seq(0,max(actuals),by=.1)
polygon(c(101+150*dlnorm(xx,meanlog=mm,sdlog=sqrt(ss.sq)),
rep(101,length(xx))),c(xx,rev(xx)),col="lightgray",border=NA)
(min.Ese <- exp(mm+ss.sq/2))
lines(c(101,150),rep(min.Ese,2),col=SAPGold,lwd=3,lty=2)
(min.Eae <- exp(mm))
lines(c(101,150),rep(min.Eae,2),col=SAPGold,lwd=3,lty=3)
(min.Eape <- exp(mm-ss.sq))
lines(c(101,150),rep(min.Eape,2),col=SAPGold,lwd=3,lty=4)
par(opar)
Приклад прокатки кісток:
SAPMediumGray <- "#999999"; SAPGold <- "#F0AB00"
set.seed(2013)
actuals <- sample(x=1:6,size=100,replace=TRUE)
opar <- par(mar=c(3,2,0,0)+.1)
plot(actuals,type="o",pch=21,cex=0.8,bg="black",xlab="",ylab="",xlim=c(0,150))
abline(v=101,col=SAPMediumGray)
min.Ese <- 3.5
lines(c(101,150),rep(min.Ese,2),col=SAPGold,lwd=3,lty=2)
min.Eape <- 2
lines(c(101,150),rep(min.Eape,2),col=SAPGold,lwd=3,lty=4)
par(opar)
Список літератури
Гнайтінг, Т. Складання та оцінка точкових прогнозів . Журнал Американської статистичної асоціації , 2011, 106, 746-762
Гудвін, П. та Лоутон, Р. Про асиметрію симетричного MAPE . Міжнародний журнал прогнозування , 1999, 15, 405-408
Гувер, Дж. Вимірювання точності прогнозу: пропуски в сьогоднішніх двигунах прогнозування та програмному плануванні попиту . Передбачення: Міжнародний журнал прикладного прогнозування , 2006, 4, 32-35
Коласса, С. Чому прогноз "найкращого" пункту залежить від міри помилки чи точності (Запрошений коментар до змагань з прогнозування М4). Міжнародний журнал прогнозування , 2020, 36 (1), 208-211
Коласа, С. та Мартін, Р. Відсотки помилок можуть зіпсувати ваш день (і прокатка кісток показує, як) . Передбачення: Міжнародний журнал прикладного прогнозування, 2011, 23, 21-29
Kolassa, S. & Schütz, W. Переваги співвідношення MAD / середнє значення щодо MAPE . Передбачення: Міжнародний журнал прикладного прогнозування , 2007, 6, 40-43
Маккензі, Дж. Середній абсолютний відсотковий похибку та упередженість в економічному прогнозуванні . Економічні листи , 2011, 113, 259-262