Розуміння прогнозів від логістичної регресії


13

Мої прогнози, що випливають з логістичної регресійної моделі (glm в R), не обмежені між 0 і 1, як я очікував. Моє розуміння логістичної регресії полягає в тому, що параметри вводу та моделі поєднуються лінійно і відповідь перетворюється на ймовірність за допомогою функції посилання logit. Оскільки функція logit обмежена між 0 і 1, я очікував, що мої прогнози будуть обмежені між 0 і 1.

Однак це не те, що я бачу, коли впроваджую логістичну регресію в R:

data(iris)
iris.sub <- subset(iris, Species%in%c("versicolor","virginica"))
model    <- glm(Species ~ Sepal.Length + Sepal.Width, data = iris.sub, 
                family = binomial(link = "logit"))
hist(predict(model))

введіть тут опис зображення

Якщо що-небудь, результат прогнозу (моделі) мені здається нормальним. Хтось може мені пояснити, чому отримані значення не є ймовірностями?


3
Відповідь Короне нижче дуже добре висвітлює деталі. Оригінальна цифра, яку ви маєте вище, представляє значення коефіцієнтів журналу на осі x, які можна математично перетворити на ймовірності (тобто відповідно до відповіді Короне, передаючи назад через функцію посилання.)
Джеймс Стенлі

Відповіді:


16

predict.glmМетод за замовчуванням повертає провісник на шкалі лінійного провісника. Тобто вони ще не пройшли функцію зв'язку.

Спробуйте

hist(predict(model, type = "response"))

замість цього

введіть тут опис зображення


4
Ви зробили чудову роботу, опанувавши наші можливості розмітки та ілюстрації за короткий час: ця відповідь є прекрасним прикладом цього. Молодці!
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.