Розподіл Tweedie може моделювати скошені дані з точковою масою в нулі, коли параметр (показник у співвідношенні середня дисперсія) знаходиться між 1 і 2.
Аналогічно, надута з нуля (будь-то безперервна чи дискретна) модель може мати велику кількість нулів.
У мене виникають проблеми з розумінням того, що це так, що коли я прогнозую або обчислюю відповідні значення за допомогою таких моделей, всі передбачені значення не дорівнюють нулю.
Чи можуть ці моделі насправді передбачити точні нулі?
Наприклад
library(tweedie)
library(statmod)
# generate data
y <- rtweedie( 100, xi=1.3, mu=1, phi=1) # xi=p
x <- y+rnorm( length(y), 0, 0.2)
# estimate p
out <- tweedie.profile( y~1, p.vec=seq(1.1, 1.9, length=9))
# fit glm
fit <- glm( y ~ x, family=tweedie(var.power=out$p.max, link.power=0))
# predict
pred <- predict.glm(fit, newdata=data.frame(x=x), type="response")
pred
тепер не містить нулів. Я подумав, що корисність таких моделей, як розподіл Tweedie, походить від його здатності передбачати точні нулі та безперервну частину.
Я знаю, що в моєму прикладі змінна x
не дуже прогнозована.