Ваше запитання може виникнути через те, що ви маєте справу зі коефіцієнтами й ймовірностями шансів, що спочатку заплутано. Оскільки логістична модель є нелінійним перетворенням обчислення довірчих інтервалів не настільки просто.βTx
Фон
Нагадаємо, що для логістичної регресійної моделі
Імовірність з :(Y=1)p=eα+β1x1+β2x21+eα+β1x1+β2x2
Коефіцієнти з :(Y=1)(p1−p)=eα+β1x1+β2x2
Коефіцієнти журналу :(Y=1)log(p1−p)=α+β1x1+β2x2
Розглянемо випадок, коли у вас на одиницю приріст змінної , тобто , то нові шанси єx1x1+1
Odds(Y=1)=eα+β1(x1+1)+β2x2=eα+β1x1+β1+β2x2
- Коефіцієнт шансів (АБО) , отже, є
Odds(x1+1)Odds(x1)=eα+β1(x1+1)+β2x2eα+β1x1+β2x2=eβ1
Інтерпретаційні коефіцієнти
Як би ви інтерпретували значення коефіцієнта ? Якщо припустити, що все інше залишається виправленим:βj
- Для кожного одиничного збільшення коефіцієнт коефіцієнта журналу збільшується на .xjβj
- При кожному збільшенні одиниці в коефіцієнт шансів збільшується на .xjeβj
- При кожному збільшенні від до коефіцієнт шансів збільшується наxjkk+ΔeβjΔ
- Якщо коефіцієнт від’ємний, то збільшення призводить до зменшення коефіцієнта шансів.xj
Інтервали довіри для одного параметраβj
Мені просто потрібно використовувати ? Або мені потрібно перетворити SE за допомогою описаного тут підходу?1.96∗SE
Оскільки параметр оцінюється за допомогою оцінки ймовірності Maxiumum, теорія MLE говорить нам, що це асимптотично нормально, і тому ми можемо використовувати великий довірчий інтервал Wald довіри, щоб отримати звичайнийβj
βj±z∗SE(βj)
Що дає довірчий інтервал на коефіцієнт коефіцієнта журналу. Використання властивості MLE дозволяє нам експоненціювати, щоб отримати
eβj±z∗SE(βj)
що є довірчим інтервалом на коефіцієнт шансів. Зауважте, що ці інтервали призначені лише для одного параметра.
Якщо я хочу зрозуміти стандартну помилку для обох змінних, як я б це вважав?
Якщо ви включите кілька параметрів, ви можете використовувати процедуру Bonferroni, інакше для всіх параметрів ви можете використовувати довірчий інтервал для оцінки ймовірності
Процедура Бонферроні для декількох параметрів
Якщо параметри слід оцінювати з коефіцієнтом довіри сім'ї приблизно , спільні межі довіри Бонферроні єg1−α
βg±z(1−α2g)SE(βg)
Інтервали довіри для оцінки ймовірності
Логістична модель дає оцінку ймовірності спостереження за одним, і ми прагнемо побудувати частотистський інтервал навколо справжньої ймовірності таким, щоpPr(pL≤p≤pU)=.95
Один із підходів, що називається перетворенням кінцевих точок, робить наступне:
- Обчисліть верхню та нижню межі довірчого інтервалу для лінійної комбінації (використовуючи КІ Wald)xTβ
- Застосуйте монотонне перетворення до кінцевих точок для отримання ймовірностей.F(xTβ)
Оскільки є монотонним перетвореннямPr(xTβ)=F(xTβ)xTβ
[Pr(xTβ)L≤Pr(xTβ)≤Pr(xTβ)U]=[F(xTβ)L≤F(xTβ)≤F(xTβ)U]
Конкретно це означає обчислити а потім застосувати перетворення logit до результату, щоб отримати нижню і верхню межі:βTx±z∗SE(βTx)
[exTβ−z∗SE(xTβ)1+exTβ−z∗SE(xTβ),exTβ+z∗SE(xTβ)1+exTβ+z∗SE(xTβ),]
Орієнтовна приблизна дисперсія може бути обчислена за допомогою матриці коваріації коефіцієнтів регресії за допомогоюxTβ
Var(xTβ)=xTΣx
Перевага цього методу полягає в тому, що межі не можуть бути поза діапазоном(0,1)
Існує також декілька інших підходів, використовуючи метод дельти, завантажувальний інструмент тощо. У кожного є свої припущення, переваги та обмеження.
Джерела та інформація
Моя улюблена книга на цю тему - "Прикладні лінійні статистичні моделі" Кутнера, Нетера, Лі, глава 14
Інакше ось декілька онлайн-джерел: