Вибір моделі з логістичною регресією Фірта


21

У невеликому наборі даних ( ), з яким я працюю, кілька змінних дають мені ідеальний прогноз / розділення . Тому я використовую логістичну регресію Фірта для вирішення цього питання.н100

Якщо я вибираю найкращу модель за допомогою AIC або BIC , чи слід включати Фірмовий штрафний строк у ймовірність при обчисленні цих інформаційних критеріїв?


2
Ви б проти зауважити, чому це неминуче, оскільки вибір змінних не допомагає із проблемою "занадто багато змінних, занадто малий розмір вибірки"?
Френк Харрелл

4
Це так само погано, як це стає.
Френк Харрелл

1
Чи розглядали ви, як вирішити цю проблему з байєсівською висновком? Четверта логістична регресія еквівалентна MAP з джеффрі. Ви можете використовувати наближене наближення для оцінки граничної ймовірності - яка є скоригованою BIC (схожою на AICc)
ймовірністьлогічного

1
@user, Оскільки такі змінні зазвичай прогнозують лише кілька випадків, і це є невідтворюваним: справжня ймовірність цієї клітини може бути близькою до 90%, але, маючи в ній лише два випадки, ви отримаєте два 81% часу .
StasK

1
Посилання для завантаження документа K&K (1996), знайденого в Google Scholar, bemlar.ism.ac.jp/zhuang/Refs/Refs/kitagawa1996biometrika.pdf
Алекос Пападопулос

Відповіді:


1

н

pу(у)=L(θ;у)π(θ)гθ
θ^

Як бічне зауваження, регрес Фірта також усуває зміщення першого порядку в експоненціальних сім'ях.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.