Існує пара правильних і строго правильних правил балів для підрахунку даних, які ви можете використовувати. Правила підрахунку балів - це штрафні санкції введені при цьому прогнозний розподіл є а - спостережуване значення. Вони мають ряд бажаних властивостей, перш за все, що прогноз, що наближається до справжньої ймовірності, завжди отримуватиме менше штрафу, і є (унікальний) найкращий прогноз, і це такий, коли передбачувана ймовірність збігається з істинною ймовірністю. Таким чином, мінімізуючи очікування означає повідомлення про справжні ймовірності. Дивіться також Вікіпедію .P y s ( y , P )s(y,P)Pys(y,P)
Часто середній показник приймає за всі прогнозовані значення як
S=1n∑ni=1s(y(i),P(i))
Яке правило взяти, залежить від вашої мети, але я дам приблизну характеристику, коли кожне добре використовувати.
У подальшому я використовую для функції передбачувальної маси ймовірностей і функції прогнозу кумулятивного розподілу. А пробігає всю підтримку розподілу рахунку (тобто ). позначає функцію індикатора. та - середнє та стандартне відхилення прогнозного розподілу (які зазвичай є безпосередньо оціненими величинами в моделях даних підрахунку). f(y)Pr(Y=y)F(y)∑k0,1,…,∞Iμσ
Суворо правильні правила скорингу
- Brier Score : (стабільний для дисбалансу розмірів у категоричних предикторах)s(y,P)=−2f(y)+∑kf2(k)
- Оцінка Давіда-Себастіані : (добре для загального вибору прогнозної моделі; стабільна для дисбалансу розмірів у категоричних прогнозах)s(y,P)=(y−μσ)2+2logσ
- Оцінка відхилення : ( - термін нормалізації, який залежить тільки від ; в моделях Пуассона це зазвичай приймається за насичений відхилення; добре для використання з оцінками з рамки ML)s(y,P)=−2logf(y)+gygyy
- Логарифмічний бал : (дуже легко обчислюється; стабільний для дисбалансу розмірів у категоричних прогнозах)s(y,P)=−logf(y)
- Рангований показник ймовірності : (добре для контрастування різних прогнозів дуже високих підрахунків; сприйнятливий до дисбалансу розмірів у категоричних прогнозах)s(y,P)=∑k{F(k)−I(y≤k)}2
- Сферична оцінка : (стабільна для дисбалансу розмірів у категоричних прогнозах)s(y,P)=f(y)∑kf2(k)√
Інші правила скорингу (не дуже правильні, але часто використовуються)
- Абсолютна оцінка помилок :(не належно)s(y,P)=|y−μ|
- Оцінка помилок у квадраті : (не суворо належно; сприйнятливі до переживань; сприйнятливі до дисбалансу розмірів у категоричних прогнозах)s(y,P)=(y−μ)2
- Нормований показник помилки Пірсона : (не суворо належно; сприйнятливий до випускників; може використовуватися для перевірки, чи перевіряється модель, чи усереднений бал сильно відрізняється від 1; стабільний дисбаланс розмірів у категоричних прогнозах)s(y,P)=(y−μσ)2
Приклад R код для строго правильних правил:
library(vcdExtra)
m1 <- glm(Freq ~ mental, family=poisson, data=Mental)
# scores for the first observation
mu <- predict(m1, type="response")[1]
x <- Mental$Freq[1]
# logarithmic (equivalent to deviance score up to a constant)
-log(dpois(x, lambda=mu))
# quadratic (brier)
-2*dpois(x,lambda=mu) + sapply(mu, function(x){ sum(dpois(1:1000,lambda=x)^2) })
# spherical
- dpois(x,mu) / sqrt(sapply(mu, function(x){ sum(dpois(1:1000,lambda=x)^2) }))
# ranked probability score
sum(ppois((-1):(x-1), mu)^2) + sum((ppois(x:10000,mu)-1)^2)
# Dawid Sebastiani
(x-mu)^2/mu + log(mu)