Діагностика логістичної регресії?


74

Для лінійної регресії ми можемо перевірити діагностичні графіки (графіки залишків, графіки нормальної QQ тощо), щоб перевірити, чи порушено припущення про лінійну регресію.

Для логістичної регресії у мене виникають проблеми з пошуком ресурсів, які пояснюють, як діагностувати придатність моделі логістичної регресії. Викопуючи деякі курсові записки для GLM, це просто стверджує, що перевірка залишків не є корисною для діагностики для відповідності логістичної регресії.

Оглядаючи Інтернет, також, здається, існують різні "діагностичні" процедури, такі як перевірка модельного відхилення та проведення тестування хі-квадратів, але інші джерела стверджують, що це недоцільно, і що вам слід виконати корисність Хосмера-Лемешоу тест. Тоді я знаходжу інші джерела, які стверджують, що цей тест може сильно залежати від фактичних значень угрупувань та граничних показників (може бути не достовірним).

То як слід діагностувати логістичну регресію?


1
Можливий дублікат (або окремий випадок) stats.stackexchange.com/questions/29271/… або stats.stackexchange.com/questions/44643/… , хоча жоден з них не має відповідей, які б насправді вирішили для вас.
Пітер Елліс

1
Рекомендую прочитати монографію Скотта Менарда, яка не так давно була доступна у повному обсязі безкоштовно в Інтернеті.
rolando2

2
Це питання корисності відповідних заходів для логістичного регресу може бути корисним (хоча корисність, звичайно, є лише невеликою частиною модельної діагностики): stats.stackexchange.com/questions/3559/logistic-regression-which-pseudo-r- squared-mjera-is-the-one-to-report-cox / 3570
Stephan Kolassa

Відповіді:


39

Кілька нових методів, які я натрапив на оцінку придатності логістичних регресійних моделей, походять з політологічних журналів:

  • Грінхілл, Брайан, Майкл Д. Уорд та Одрі Сакс. 2011. Сюжет розділення: новий візуальний метод для оцінки відповідності бінарних моделей. Американський журнал політичних наук 55 (4): 991-1002 .
  • Есарей, Джастін та Ендрю Пірс. 2012. Оцінка якості придатності та тестування на неправильне визначення у бінарних залежних змінних моделях. Політичний аналіз 20 (4): 480-500 . Передрук PDF тут

Обидві ці методи мають на меті замінити тести на придатність (Fit), як Hosmer & Lemeshow, та визначити потенційну неправильну специфікацію (зокрема, нелінійність включених змінних в рівняння). Вони особливо корисні, оскільки типові міри придатності R-квадрата часто піддаються критиці .

В обох наведених вище документах використовуються прогнозовані ймовірності порівняно зі спостережуваними результатами у графіках - дещо уникаючи неясного питання про те, що є залишком у таких моделях. Приклади залишків можуть бути внеском у ймовірність журналу або залишки Пірсона (я вважаю, що їх набагато більше). Інший захід, який часто представляє інтерес (хоча і не є залишковим), є показники DFBeta (сума коефіцієнта, що оцінюється коефіцієнтом, змінюється, коли спостереження виключається з моделі). Дивіться приклади в Stata для цієї сторінки UCLA на сторінці "Діагностика логістичної регресії" разом з іншими потенційними діагностичними процедурами.

Мені це не зручно, але я вважаю, що регресійні моделі Дж. Скотта Лонга для категоричних і обмежених залежних змінних детально розглядають всі ці різні діагностичні заходи просто.


2
На логістичній регресії існують пакети інших книг (принаймні частинами, якщо не цілістю). Різні категоричні підручники з аналізу даних Агрешти, Скотт Менард, Хосмер та Лемешоу та книга RMS Френка Харрелла - це все те, що я бачив, рекомендував на цьому форумі різними авторами.
Andy W

Спасибі за вашу відповідь. Напевно, немає простої відповіді на моє запитання. Я погляну на ваші рекомендації. Ура.
ialm

23

Питання було недостатньо мотивоване. Має бути причина для проведення модельної діагностики, наприклад

  • Потенціал змінити модель, щоб зробити її кращою
  • Не знаючи, які спрямовані тести використовувати (тобто тести на нелінійність чи взаємодію)
  • Якщо не зрозуміти, що зміна моделі може легко спотворити статистичні умовиводи (стандартні помилки, довірчі інтервали, )P

За винятком перевірки речей, ортогональних специфікації алгебраїчної регресії (наприклад, вивчення розподілу залишків у звичайних лінійних моделях), діагностика моделі може створити стільки проблем, скільки вони вирішують, на мою думку. Особливо це стосується бінарної логістичної моделі, оскільки вона не має припущення щодо розподілу.

Тому зазвичай краще витратити час на конкретизацію моделі, особливо не вважати лінійність для змінних, які вважаються сильними, для яких жодні попередні докази не свідчать про лінійність. У деяких випадках ви можете заздалегідь вказати модель, яка повинна відповідати, наприклад, якщо кількість предикторів невелика або ви дозволяєте всім передбачувачам бути нелінійними та (правильно) припускати відсутність взаємодій.

Кожен, хто відчуває, що діагностику моделі можна використовувати для зміни моделі, повинен запустити цей процес у циклі завантаження, щоб правильно оцінити індуковані невизначеності моделі.


4
Я погоджуюся, що діагностика моделі повинна випливати з мети моделювання. Однак у вашому вступному пункті склалося враження, що ви вважаєте, що ми не повинні перевіряти моделі, які ми підходимо до даних. Я майже впевнений, що це не те, що ти мав на увазі. Крім того, бінарна логістична модель, безумовно , має припущення щодо розподілу! (Найбільш очевидним є те, що для відповіді існує лише два значення)
ймовірністьлогічний

3
Крім припущення, що існує лише 2 конкретні можливі значення для Y, двійкова логістична модель не має жодних перешкод. припущення. Я особисто не дуже часто використовую діагностичні схеми з логістичною регресією, замість цього вказуючи моделі, які є досить гнучкими, щоб будь-яким чином відповідати даним, розмір вибірки дає нам розкіш для вивчення. В OLS основний діагностичний графік, який я використовую, - графік qq для нормальності залишків.
Френк Харрелл

З точки зору узагальненої лінійної моделі, логістична модель виникає з біноміального розподілу (розподіл Бернуллі). Але навіть тоді важко трактувати залишки.
New_to_this

Якщо говорити про розподіли, коли випадкова величина може приймати лише два значення (тобто розподіл Бернуллі), не є корисним, оскільки немає можливості, що припущення розподілу можуть піти не так, якщо спостереження не будуть незалежними.
Френк Харрелл

1
@FrankHarrell Я розумію, що ви знаєте, про що ви тут говорите, але я не думаю, що всій спільноті з вашого допису / коментарів буде зрозуміло, що неправильна специфікація лінійного передбачувача (або навіть передбачувача добавок у GAM Framework) може спричинити проблеми для логістичної регресії. Багато хто може не оцінити, що це створює, як ви говорите, незалежність даних. Коли учні вперше стикаються з лінійною регресією, вони вчаться перевіряти залишки, не розрізняючи неправильну специфікацію лінійного предиктора і неправильну розподіл помилок.
Яків Соколар

5

Цей потік є досить старим, але я вважав, що було б корисно додати, що з недавнього часу ви можете використовувати пакет DHARMa R для перетворення залишків будь-якого GL (M) M в стандартизований простір. Після цього ви зможете візуально оцінити / перевірити залишкові проблеми, такі як відхилення від розподілу, залишкова залежність від предиктора, гетерокедастичність або автокореляція у звичайний спосіб. Дивіться віньєтку на упаковці для детально пророблених прикладів, а також інші запитання щодо резюме тут і тут .

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.