Оцінка логістичних регресійних моделей


13

Це питання виникає з моєї фактичної плутанини щодо того, як вирішити, чи достатньо хороша логістична модель. У мене є моделі, які використовують стан пар індивідуальний проект через два роки після їх формування як залежної змінної. Результат успішний (1) чи ні (0). У мене є незалежні змінні, виміряні в момент утворення пар. Моя мета - перевірити, чи може змінна, за якою я вважав, впливати на успіх пар, впливатиме на цей успіх, контролюючи інші потенційні впливи. У моделях змінна інтерес є значною.

Моделі були оцінені за допомогою glm()функції в R. Для оцінки якості моделей, я зробив кілька речей: glm()дає вам residual deviance, то AICі BICза замовчуванням. Крім того, я підрахував коефіцієнт похибки моделі та побудував схему залишків, породжених у кошику.

  • Повна модель має менший залишковий відхилення, AIC та BIC, ніж інші моделі, які я оцінив (і які вкладені в повну модель), що змушує мене думати, що ця модель "краща", ніж інші.
  • Частота помилок моделі досить низька, IMHO (як у Gelman and Hill, 2007, с. 99 ):,
    error.rate <- mean((predicted>0.5 & y==0) | (predicted<0.5 & y==1)приблизно 20%.

Все йде нормально. Але коли я розміщую залишкову залишку (знову слідуючи порадам Гельмана та Хілла), значна частина бункерів випадає за межі 95% ІС: Сюжет залишків

Цей сюжет спонукає мене думати, що в моделі щось зовсім не так. Чи повинно це призвести до того, щоб я скинув модель? Чи слід визнати, що модель недосконала, але зберігати її та інтерпретувати ефект змінної, що цікавить? Я пограбував, виключаючи змінні по черзі, а також деяку трансформацію, не вдосконалюючи при цьому дійсно покращений графік залишків.

Редагувати:

  • На даний момент модель має десяток прогнозів і 5 ефектів взаємодії.
  • Пари "відносно" незалежні одна від одної в тому сенсі, що всі вони формуються за короткий проміжок часу (але не строго кажучи, все одночасно) і є багато проектів (13 к) і багато людей (19 к ), тому неабияку частку проектів приєднує лише одна людина (налічується близько 20000 пар).

2
Приблизна оцінка мінімального розміру вибірки, необхідного для того, щоб робити те, що ви робите, полягає в тому, що вам потрібно, щоб мінімум кількості подій або кількість не-подій перевищив 15 разів (12 + 5), якщо припустити, що у вас було 17 кандидатських термінів у модель. Якщо ви зробили будь-який скринінг прогнозів , використовуючи , всі ставки будуть зняті. Y
Френк Харрелл

1
Виходячи з того, що ви говорите, розмір вибірки не здається проблемою, оскільки у мене близько 20000 тис. Пар (з яких приблизно 20% є успішними).
Антуан Вернет

Відповіді:


11

Точність класифікації (коефіцієнт помилок) - це неправильне правило балів (оптимізоване хибною моделлю), довільне, переривчасте та просте в маніпулюванні. Це не потрібно в цьому контексті.

Ви не вказували, скільки було прогнозів. Замість того, щоб оцінювати відповідність моделі, я б спокусився просто зробити модель підходящою. Компромісний підхід полягає в тому, щоб припустити, що взаємодія не важлива, а також дозволяти безперервним прогнозистам бути нелінійними за допомогою регресійних сплайнів. Накресліть оціночні відносини. rmsПакет в R робить все це відносно легко. Для отримання додаткової інформації див. Http://biostat.mc.vanderbilt.edu/rms .

Ви можете детальніше зупинитися на "парах" та незалежності ваших спостережень.


Якщо я правильно розумію, ваша порада зосередитись на сюжеті залишків і зрозуміти це перед тим, як робити щось інше, зрештою, використовуючи регресійні сплайни, чи я правильно? Я відредагував питання, щоб сказати, скільки існує прогнозів і що пари "відносно" незалежні.
Антуан Вернет

Привіт @Frank Чому, на вашу думку, точність класифікації - це поганий метод? Це тому, що вона тут оцінюється за тими ж даними, де похідна модель?
Пітер Флом - Відновіть Моніку

2
χ2c

2
Ні, я маю на увазі дозволити безперервним прогнозистам діяти нелінійно за шкалою відхилень журналу, розширюючи їх на кілька термінів за допомогою обмежених кубічних сплайнів (природних сплайнів). Потім побудуйте розрахункові перетворення, щоб дізнатися про часткові ефекти кожного прогноктора.
Френк Харрелл

1
Дякую за вклад, що було дуже корисно. Поглибившись із даними, я зрозумів, що у мене виникли проблеми колінеарності (навіть якщо у мене немає високих парних кореляцій).
Антуан Вернет

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.