Я не знаю, чи можу я дати вам повну відповідь, але я можу дати вам кілька думок, які можуть бути корисними. По-перше, всі статистичні моделі / тести мають припущення. Однак логістична регресія дуже не передбачає, що залишки нормально розподіляються, а також, що дисперсія є постійною. Скоріше передбачається, що дані поширюються як двочлен, , тобто з кількістю випробувань Бернуллі, рівним кількості спостережень у тому точному наборі величин коваріату та з ймовірністю, пов'язаною з цим набором значень коваріату. Пам'ятайте, що дисперсія двочлена є . Таким чином, якщоn p ( 1 - p ) nB(nxi,pxi)np(1−p)nваріюють на різних рівнях коваріату, також будуть відхилення. Далі, якщо будь-який з коваріатів взагалі пов'язаний зі змінною відповіді, то ймовірності будуть змінюватися, і, таким чином, будуть змінюватися і дисперсії. Це важливі факти щодо логістичної регресії.
По-друге, порівняння моделей зазвичай проводиться між моделями з різними специфікаціями (наприклад, з різними наборами коваріатів), а не над різними підмножинами даних. Якщо чесно, я не впевнений, як це було б правильно зробити. З лінійної моделлю, можна подивитися на 2 з , щоб побачити , наскільки краще підгонка з аномальними даними виключені, але це буде тільки описову, і ви повинні знати , що буде мати йти вгору. Однак при логістичній регресії стандарт не може бути використаний. Існують різні 'псевдо-R 2 R 2 R 2 R 2 R 2R2R2R2R2s ', розроблені для надання подібної інформації, але вони часто вважаються недоліками і не часто використовуються. Огляд різних псевдо- s, які існують, дивіться тут . Деякі дискусії та критику з них дивіться тут . Іншою можливістю може бути вилучення бета-версії з включеними аутлайнерами і без того, щоб побачити, як їх виключення сприяє стабілізації розподілу вибірки. Знову ж таки, це буде лише описовим (тобто, це не буде тестом, щоб визначити, якій моделі - наприклад, підмножині ваших даних - віддати перевагу), і дисперсія повинна знизитися. Ці речі правдиві для обох псевдо-R2R2s та дистрибутивом jackknifed, оскільки ви вибрали ці дані для виключення, виходячи з того, що вони здаються крайніми.