Поведінка, яку ви спостерігаєте, є "типовим" випадком логістичної регресії, але не завжди відповідає дійсності. Він також має значно більшу загальність (див. Нижче). Це наслідок злиття трьох окремих фактів.
- Вибір моделювання лог-коефіцієнтів як лінійної функції предикторів,
- Використання максимальної ймовірності для отримання оцінок коефіцієнтів у моделі логістичної регресії та
- Включення в модель терміна перехоплення.
Якщо будь-якого з перерахованих вище немає, то середні оцінені ймовірності, як правило, не збігаються із співвідношенням у вибірці.
Однак (майже) все статистичне програмне забезпечення використовує оцінку максимальної ймовірності для таких моделей, тому на практиці пункти 1 і 2, по суті, завжди присутні, а пункт 3 зазвичай присутній, за винятком особливих випадків.
Деякі деталі
У типовій системі логістичної регресії ми спостерігаємо результат незалежних біноміальних випробувань з вірогідністю . Нехай y я - спостережувані відповіді. Тоді повна ймовірність
L = n ∏ i = 1 p y i i ( 1 - p i ) 1 - y i = n ∏ i = 1 exp ( y i log ( p i / ( 1 - p ))piуi
і тому ймовірність журналу дорівнює
ℓ = n ∑ i = 1 y i log ( p i / ( 1 - p i ) ) + n ∑ i = 1 log ( 1 - p i )
L = ∏i = 1нpуii( 1 - сi)1 - уi= ∏i = 1ндосвід( уiжурнал(сi/ (1- сi) ) + журнал( 1 -сi)),
ℓ = ∑i = 1нуiжурнал( сi/ (1- сi) ) + ∑i = 1нжурнал( 1 - сi).
Тепер у нас є вектор предикторів для кожного спостереження, а з факту 1 вище модель логістичної регресії позиціонує цей
log p iхi
журналpi1 - сi= βТхi,
βpi= 1 / ( 1 + е- βТхi)
∂ℓ / ∂β= 0
∂ℓ∂β= ∑iуiхi- ∑iхi1 + експ( - βТхi)= ∑iуiхi- ∑ipiхi,
∑iуiхi= ∑ip^iхi,
p^i= ( 1 + досвід( - β^Тхi) )- 1 в цьому випадку.
хiji∑iуiхi j= ∑iуi= ∑ip^i і так емпіричне співвідношення позитивних відповідей відповідає середньому встановлені ймовірності.
Моделювання
R
x <- rnorm(100)
p <- 1/(1+exp(-3*x))
y <- runif(100) <= p
mean(y)
# Should be identical to mean(y)
mean( predict( glm(y~x, family="binomial"), type="response" ) )
# Won't be identical (usually) to mean(y)
mean( predict( glm(y~x+0, family="binomial"), type="response") )
Загальний випадок : як уже згадувалося вище, властивість, що середня реакція дорівнює середній прогнозованій середній, має набагато більшу загальність для класу узагальнених лінійних моделей, що відповідають максимальній вірогідності, використовуючи канонічну функцію зв'язку та включаючи перехоплення в модель.
Список літератури
Деякі хороші посилання на пов'язану теорію наступні.
- A. Agresti (2002), категоричний аналіз даних , 2-е видання, Wiley.
- P. McCullagh та JA Nelder (1989), Узагальнені лінійні моделі , 2-е видання, Chapman & Hall. (Текст оригінальних авторів загальних методів.)