Щоб краще задати своє запитання, я надав деякі результати як з 16 змінної моделі ( fit
), так і з 17 змінною моделлю ( fit2
) нижче (всі змінні прогнозувальника в цих моделях є безперервними, де єдиною відмінністю між цими моделями є те, fit
що не містять змінну 17 (var17)):
fit Model Likelihood Discrimination Rank Discrim.
Ratio Test Indexes Indexes
Obs 102849 LR chi2 13602.84 R2 0.173 C 0.703
0 69833 d.f. 17 g 1.150 Dxy 0.407
1 33016 Pr(> chi2) <0.0001 gr 3.160 gamma 0.416
max |deriv| 3e-05 gp 0.180 tau-a 0.177
Brier 0.190
fit2 Model Likelihood Discrimination Rank Discrim.
Ratio Test Indexes Indexes
Obs 102849 LR chi2 13639.70 R2 0.174 C 0.703
0 69833 d.f. 18 g 1.154 Dxy 0.407
1 33016 Pr(> chi2) <0.0001 gr 3.170 gamma 0.412
max |deriv| 3e-05 gp 0.180 tau-a 0.177
Brier 0.190
Я використовував rms
пакет Френка Харрелла для створення цих lrm
моделей. Як бачимо, ці моделі, як правило, не сильно різняться в різних показниках дискримінації та рейтинговій дискримінації. Індекси ; однак, використовуючи lrtest(fit,fit2)
, мені було надано такі результати:
L.R. Chisq d.f. P
3.685374e+01 1.000000e+00 1.273315e-09
Як такий, ми би відкинули нульову гіпотезу цього тесту на коефіцієнт ймовірності; однак я б припустив, що це, ймовірно, пов'язано з великим розміром вибірки ( n = 102849), оскільки ці моделі, схоже, виконують аналогічно. Крім того, мені цікаво знайти кращий спосіб формального порівняння вкладених моделей бінарної логістичної регресії, коли n великий.
Я дуже вдячний за будь-який зворотний зв’язок, сценарії R або документацію, які можуть направити мене в правильному напрямку з точки зору порівняння цих типів вкладених моделей! Дякую!
fit2
це 17 мінлива модель, але вона також не відповідає V17
. Можливо, ви захочете це змінити.
fit2
щоб fit
в наведеному вище прикладі відповідно з вашою корекцією. Дякую!