Зрозуміло, що пропозиція Грега - це перше, що потрібно спробувати: регресія Пуассона - природна модель у багатьох багатьох конкретних ситуацій.
Однак модель, яку ви пропонуєте, може виникнути, наприклад, коли ви спостерігаєте закруглені дані:
з iid нормальними помилками .
Yi= ⌊ ахi+ b +ϵi⌋ ,
ϵi
Я думаю, що це цікаво, щоб подивитися, що з цим можна зробити. Я позначаю через cdf стандартної звичайної змінної. Якщо , то
використовуючи знайомі комп'ютерні позначення.Жϵ ∼ N( 0 ,σ2)
P ( ⌊ a x + b + ϵ ⌋ = k )= F(k - b + 1 - a xσ) -F(k - b - a xσ)= p n o r m ( k + 1 - a x - b , s d= σ) - п н о р м ( k - a x - b , s d= σ) ,
Ви спостерігаєте точки даних . Імовірність журналу задається
Це не тотожне найменшим квадратам. Ви можете спробувати максимізувати це числовим методом. Ось ілюстрація в R:(хi,уi)
ℓ ( a , b , σ) =∑iжурнал( F(уi- b + 1 - aхiσ) -F(уi- б - ахiσ) ) .
log_lik <- function(a,b,s,x,y)
sum(log(pnorm(y+1-a*x-b, sd=s) - pnorm(y-a*x-b, sd=s)));
x <- 0:20
y <- floor(x+3+rnorm(length(x), sd=3))
plot(x,y, pch=19)
optim(c(1,1,1), function(p) -log_lik(p[1], p[2], p[3], x, y)) -> r
abline(r$par[2], r$par[1], lty=2, col="red")
t <- seq(0,20,by=0.01)
lines(t, floor( r$par[1]*t+r$par[2]), col="green")
lm(y~x) -> r1
abline(r1, lty=2, col="blue");

У червоному та синьому кольорах рядки знайдені шляхом чисельної максимізації цієї ймовірності та найменших квадратів відповідно. Зелена сходи - це для знайденої з максимальної ймовірності ... це говорить про те, що ви можете використовувати найменші квадрати, до перекладу на 0,5, і отримати приблизно однаковий результат; або, що найменші квадрати добре вписуються в модель
де - найближче ціле число. Округлені дані настільки часто зустрічаються, що я впевнений, що це відомо і було вивчено широко ...a x + b⌊ a x + b ⌋а , бб
Yi= [ ахi+ b +ϵi] ,
[ x ] = ⌊ x + 0,5 ⌋