Статистика тесту для тесту Хосмера-Лемешоу (HLT) на корисність (GOF) моделі логістичної регресії визначається наступним чином:
Потім зразок розбивають на децилів, , на децил, обчислюють такі величини:
- D d , тобто спостерігається кількість позитивних випадків у децилі ;
- , тобто спостерігається кількість негативних випадків у децилі ;
- , тобто передбачувана кількість позитивних випадків у децилі ;
- , тобто передбачувана кількість негативних випадків у децилі ;
де - спостережуваний бінарний результат для -го спостереження, а - прогнозована ймовірність цього спостереження.π я
Потім тестова статистика визначається як:
де - середня оцінена ймовірність у децилі g, а n_g - кількість компаній у децилі.гпг
Згідно Хосмера-Лемешоу (див. Це посилання ), ця статистика має (за певних припущень) розподіл \ chi ^ 2 з (d-2) ступенями свободи .
З іншого боку , якщо я б визначив таблицю на випадок надзвичайних ситуацій з рядками (що відповідають децилам) та 2 стовпцями (що відповідають істинному / хибному двійковому результату), то тестова статистика для тесту для цієї таблиці непередбачених ситуацій буде те саме, що визначено вище , однак у випадку таблиці непередбачених ситуацій ця тестова статистика є з градусів свободи . Так на один ступінь свободи більше !
Як можна пояснити цю різницю в кількості ступенів свободи?
EDIT: доповнення після прочитання коментарів:
@whuber
Вони кажуть (див. Hosmer DW, Lemeshow S. (1980), тест на придатність для моделі множинної логістичної регресії. Комунікації в статистиці, A10, 1043-1069 ), що існує теорема, продемонстрована Муром і Спрілл, з якої випливає, що якщо (1) параметри оцінюються за допомогою функцій вірогідності для негрупованих даних та (2) частоти в таблиці 2xg залежать від розрахункових параметрів, а саме комірки є випадковими, а не фіксованими, то тоді, у відповідних умовах регулярності, корисністю статистики придатності під (1) та (2) є центральна хі-площа зі звичайним зменшенням ступенів свободи за оцінними параметрами плюс сума зважених чи-квадратних змінних.
Потім, якщо я добре розумію їхню статтю, вони намагаються знайти наближення до цього «терміну корекції», що, якщо я це добре зрозумів, це зважена сума випадкових змінних чи-квадратних величин, і вони роблять це, роблячи імітацію, але я повинен визнати, що я не повністю розумію, що вони там кажуть, звідси моє запитання; чому ці клітини випадкові, як це впливає на ступінь свободи? Чи було б інакше, якби я встановив межі комірок, а потім класифікую спостереження у фіксованих клітинках на основі оціночного балу, у такому випадку клітини не є випадковими, хоча "вміст" клітини є?
@Frank Harell: чи не могло бути те, що "недоліки" тесту Хосмера-Лемешоу, про які ви згадуєте у коментарях нижче, є лише наслідком наближення зваженої суми чи-квадратів ?
rms
пакет R residuals.lrm
та val.prob
функції.