Ступені свободи


33

Статистика тесту для тесту Хосмера-Лемешоу (HLT) на корисність (GOF) моделі логістичної регресії визначається наступним чином:

Потім зразок розбивають на децилів, , на децил, обчислюють такі величини:d=10D1,D2,,Dd

  • D dO1d=iDdyi , тобто спостерігається кількість позитивних випадків у децилі ;Dd
  • O0d=iDd(1yi) , тобто спостерігається кількість негативних випадків у децилі ;Dd
  • E1d=iDdπ^i , тобто передбачувана кількість позитивних випадків у децилі ;Dd
  • E0d=iDd(1π^i) , тобто передбачувана кількість негативних випадків у децилі ;Dd

де - спостережуваний бінарний результат для -го спостереження, а - прогнозована ймовірність цього спостереження.yiπ яiπ^i

Потім тестова статистика визначається як:

X2=h=01g=1d((OhgEhg)2Ehg)=g=1d(O1gngπ^gng(1π^g)π^g)2,

де - середня оцінена ймовірність у децилі g, а n_g - кількість компаній у децилі.гпгπ^ggng

Згідно Хосмера-Лемешоу (див. Це посилання ), ця статистика має (за певних припущень) розподіл \ chi ^ 2 з (d-2) ступенями свободи . χ2(d2)

З іншого боку , якщо я б визначив таблицю на випадок надзвичайних ситуацій з d рядками (що відповідають децилам) та 2 стовпцями (що відповідають істинному / хибному двійковому результату), то тестова статистика для тесту χ2 для цієї таблиці непередбачених ситуацій буде те саме, що визначено вище X2 , однак у випадку таблиці непередбачених ситуацій ця тестова статистика є χ2 з (d1)(21)=d1 градусів свободи . Так на один ступінь свободи більше !

Як можна пояснити цю різницю в кількості ступенів свободи?

EDIT: доповнення після прочитання коментарів:

@whuber

Вони кажуть (див. Hosmer DW, Lemeshow S. (1980), тест на придатність для моделі множинної логістичної регресії. Комунікації в статистиці, A10, 1043-1069 ), що існує теорема, продемонстрована Муром і Спрілл, з якої випливає, що якщо (1) параметри оцінюються за допомогою функцій вірогідності для негрупованих даних та (2) частоти в таблиці 2xg залежать від розрахункових параметрів, а саме комірки є випадковими, а не фіксованими, то тоді, у відповідних умовах регулярності, корисністю статистики придатності під (1) та (2) є центральна хі-площа зі звичайним зменшенням ступенів свободи за оцінними параметрами плюс сума зважених чи-квадратних змінних.

Потім, якщо я добре розумію їхню статтю, вони намагаються знайти наближення до цього «терміну корекції», що, якщо я це добре зрозумів, це зважена сума випадкових змінних чи-квадратних величин, і вони роблять це, роблячи імітацію, але я повинен визнати, що я не повністю розумію, що вони там кажуть, звідси моє запитання; чому ці клітини випадкові, як це впливає на ступінь свободи? Чи було б інакше, якби я встановив межі комірок, а потім класифікую спостереження у фіксованих клітинках на основі оціночного балу, у такому випадку клітини не є випадковими, хоча "вміст" клітини є?

@Frank Harell: чи не могло бути те, що "недоліки" тесту Хосмера-Лемешоу, про які ви згадуєте у коментарях нижче, є лише наслідком наближення зваженої суми чи-квадратів ?


9
Книга містить докладний опис цього тесту та основу для нього. На ваше запитання повністю відповіді на стор. 145-149. Визначення ступенів свободи в тестах - тонка річ, оскільки більшість цих тестів є наближеними (в першу чергу), і ці наближення хороші лише тоді, коли застосовуються, здавалося б, незначні технічні умови. Дещо з цього питання див. Stats.stackexchange.com/a/17148 . H&L взяла суто практичний шлях: вони базували свою рекомендацію щодо DF на "широкому наборі моделювання". d - 2χ2d2
whuber

4
Цей тест нині вважається застарілим через (1) відсутність потужності, (2) скорочення безперервних ймовірностей та (3) свавілля у виборі бінінгу та вибору визначення децилів. Рекомендується тест Hosmer - le Cessie 1 df або тест Spiegelhalter. Див., Наприклад, rmsпакет R residuals.lrmта val.probфункції.
Френк Харрелл

2
@Frank Harell: (а) навіть тест Хосмера-Лемешоу є застарілим, я думаю, що все ще цікаво зрозуміти різницю з і (b) чи є у вас посилання, яке показує, що тест Шпігельхальтера має більшу потужність, ніж тест Хосмера-Лемешоу? χ2

2
Ці питання IMHO дуже малі порівняно з початковим запитанням.
Френк Харрелл

3
Я думаю, деталі з’являються в інших місцях на цьому сайті. Якщо коротко, (1) Хосмер показав тест довільним - дуже чутливий до того, як саме обчислюються децили; (2) їй не вистачає енергії. Ви можете бачити, що вона базується на неточних кількостях, будуючи побудовану калібровану криву (на відміну від плавної калібрувальної кривої) та відзначаючи стрибки. Крім того, він не належним чином штрафує за екстремальний наряд.
Френк Харрелл

Відповіді:


2

Hosmer DW, Lemeshow S. (1980), тест на придатність для моделі множинної логістичної регресії. Зв'язок у статистиці, A10, 1043-1069 показує, що:

Якщо модель є логістичною регресійною моделлю, а параметри оцінюються за максимальною вірогідністю, а групи визначаються за оцінкою ймовірності, то випливає, що - асимптотично (Хосмер, Лемешоу, 1980, с.1052, теорема 2).G X 2 χ 2 ( G - p - 1 ) + p + 1 i = 1 λ i χ 2 i ( 1 )pGX2χ2(Gp1)+i=1p+1λiχi2(1)

(Примітка: необхідні умови явно не викладені в теоремі 2 на сторінці 1052, але якщо хтось уважно читає папір і доказ, то вони спливають)

Другий доданок результатом того, що групування базується на оціночних - тобто випадкових - величинах (Hosmer, Lemeshow, 1980, p. 1051)i=1p+1λiχi2(1)

Використовуючи моделювання, вони показали, що другий член може бути (у випадках, що використовуються в симуляції), апроксимірований a (Hosmer, Lemeshow, 1980, с.1060)χ2(p1)

Поєднання цих двох фактів призводить до суми двох змінних , одна з ступенями свободи і друга з ступенями свободи абоχ2Gp1p1X2χ2(Gp1+p1=G2)

Тож відповідь на питання полягає у виникненні «зваженого чі-квадратного терміна» або у тому, що групи визначаються за допомогою оціночних ймовірностей, які самі є випадковими змінними.

Дивіться також Документ Хосмера Лемешоу (1980) - Теорема 2


"Отже, відповідь на питання полягає у виникненні" зваженого чі-квадратного терміна " і в тому, що групи визначаються з використанням оціночних ймовірностей, які самі є випадковими змінними." А ) Орієнтовні ймовірності дозволяють отримати додаткове зменшення p + 1, що робить основну різницю у випадку таблиці непередбачених ситуацій (в якій оцінюються лише g доданків). В ) Зважений зважений чи-квадратний термін виникає як корекція, оскільки оцінка не є імовірною оцінкою або не менш ефективною, і це робить ефект від зменшення менш додатковим, ніж (p + 1).
Секст Емпірік

@Martijn Weterings: Я маю рацію, якщо я роблю висновок, що те, що ви говорите в цьому коментарі, не є таким самим поясненням (не кажучи зовсім іншим), як те, що ви говорите у своїй відповіді? Чи приводить ваш коментар до висновку, що df є ? G2

Моя відповідь пояснює інтуїцію за різницею ступенів свободи порівняно з міркуванням на основі "тестової статистики для тесту для цієї таблиці на випадок надзвичайних ситуацій", і пояснює, чому вони різні (оцінка випадку фіксованих комірок). Основна увага приділяється «звичайному скороченню», з якого ви б зробили висновок, що df буде G-3. Однак певні умови для "звичайного зменшення" не виконуються. З цієї причини (випадкові клітинки) ви отримуєте складніші терміни з зваженим чі-квадратним терміном як корекцію, і ви фактично закінчуєте G-2. Це далеко не зовсім інше. χ2
Секст Емпірік

@ Martijn Weterings, вибач, але я не можу підтвердити, тому що я взагалі не бачу такого поняття, як "випадкові клітини" у вашій відповіді, ви маєте на увазі, що всі ваші приємні фотографії (і я маю на увазі це, вони дуже приємні) поясніть щось про «випадкові клітини» чи ви придумали це поняття, прочитавши мою відповідь?

Не шкодуй. Я погоджуюся, що моя відповідь не є точною відповіддю, щоб точно показати ступеня свободи в тесті на HL. Мені про це шкода. У вас є статистика Черноффа Лемана (з також випадковими клітинками), яка випливає з i=1ks1χ2(1)+i=ksk1λiχi2(1)розповсюдження. На даний момент мені незрозуміло, яка частина вас хвилює, я сподіваюся, ви можете бути більш конструктивними в цьому. Якщо ви хочете, щоб все було пояснено, у вас уже є статті для цього. У моїй відповіді якраз і було вирішено пояснюючи основну відмінність тесту на таблицю на випадок надзвичайних ситуацій. i=1ks1χ2(1)
Секст Емпірік

2

Теорема, на яку ви посилаєтесь (звичайна частина скорочення "звичайне зменшення ступенів свободи за оцінними параметрами"), здебільшого відстоювала Р. А. Фішер. У «Про інтерпретацію площі Чі від таблиць на випадок та обчислення Р» (1922) він стверджував, що використовувати правило і в «Добрості пристосування формул регресії» ( 1922) він стверджує, щоб зменшити ступінь свободи на кількість параметрів, що використовуються в регресії, щоб отримати очікувані значення з даних. (Цікаво відзначити, що люди неправомірно використовували тест-квадрат з неправильними ступенями свободи більше двадцяти років з моменту його введення в 1900 році)(R1)(C1)

Ваш випадок другого роду (регресія), а не колишнього виду (таблиця непередбачених ситуацій), хоча вони пов'язані між собою тим, що вони є лінійними обмеженнями параметрів.

Оскільки ви моделюєте очікувані значення на основі спостережуваних значень, і ви робите це з моделлю, яка має два параметри, "звичайне" зменшення ступенів свободи - два плюс один (додаткове, оскільки O_i потрібно підсумовувати до загальна сума, що є ще одним лінійним обмеженням, і ви закінчуєтесь ефективно зменшенням двох, а не трьох, через "неефективність" модельованих очікуваних значень).


Тест-ква-квадрат використовує як міру відстані, щоб виразити, наскільки близький результат до очікуваних даних. У багатьох версіях тестів на квадратичний чи розподіл цієї "відстані" пов'язаний із сумою відхилень у нормальних розподілених змінних (що справедливо лише в обмеженні і є наближенням, якщо ви маєте справу з не нормальними розподіленими даними) .χ2

Для багатоваріантного нормального розподілу функція густини пов'язана з byχ2

f(x1,...,xk)=e12χ2(2π)k|Σ|

з визначник матриці коваріації x|Σ|x

і є Махаланобіса відстань , яке зводиться до евклідова відстань , якщо Е = I .χ2=(xμ)TΣ1(xμ)Σ=I

У своїй статті 1900 р. Пірсон стверджував, що рівні сфероїди і що він може трансформуватися до сферичних координат, щоб інтегрувати таке значення, як P ( χ 2 > a ) . Який стає єдиним інтегралом.χ2P(χ2>a)


Саме це геометричне зображення, як відстань, а також термін у функції щільності, може допомогти зрозуміти зменшення ступенів свободи за наявності лінійних обмежень.χ2

Спочатку випадок таблиці 2x2 на випадок надзвичайних ситуацій . Ви повинні помітити, що чотири значення не єчотирманезалежними нормально розподіленими змінними. Натомість вони пов'язані один з одним і зводяться до однієї змінної.OiEiEi

Дозволяє використовувати таблицю

Oij=o11o12o21o22

то якщо очікувані значення

Eij=e11e12e21e22

де зафіксовано тоді oijeijeijeijoijoe

(o11e11)=(o22e22)=(o21e21)=(o12e12)=o11(o11+o12)(o11+o21)(o11+o12+o21+o22)

χ2

β0β_oieifourp+1

oeyiβxiϵiϵiне може прийняти будь-яке можливе значення! А саме вони зменшуються на частину, яка проектується на модель, і більш конкретно на 1 вимір для кожного параметра в моделі.


Можливо, наступні зображення можуть трохи допомогти

B(n=60,p=1/6,2/6,3/6)N(μ=np,σ2=np(1p))χ2=1,2,6χ0ae12χ2χd1dχχd1χ

графічне зображення чі ^ 2

Зображення нижче може бути використане для отримання уявлення про зменшення розмірів у залишкових доданках. Він пояснює метод розміщення найменших квадратів в геометричному виразі.

У синьому кольорі у вас вимірювання. У червоному кольорі у вас є те, що дозволяє модель. Вимірювання часто не точно відповідає моделі та має деяке відхилення. Ви можете розглядати це, геометрично, як відстань від вимірюваної точки до червоної поверхні.

mu1mu2(1,1,1)(0,1,2)

[x1x2x3]=a[111]+b[012]+[ϵ1ϵ2ϵ3]

(1,1,1)(0,1,2)xϵ

Тож ця різниця між спостережуваним та (модельованим) очікуваним є сумою векторів, які перпендикулярні модельному вектору (і цей простір має розмір загального простору за вирахуванням кількості модельних векторів).

У нашому простому прикладі. Загальний розмір - 3. Модель має 2 розміри. І помилка має розмірність 1 (тому незалежно від того, яку із синіх точок ви берете, зелені стрілки показують єдиний приклад, умови помилки завжди мають однакове співвідношення, слідуйте за одним вектором).

графічне зображення зменшення регресійного розміру


χ2

oeeenp(1p)


2
χ2p>1

енp(1-p)

np(1p)

(d1p)β0β

.... у будь-якому випадку, я пояснив, чому ми не отримуємо розмірність d-1 (і натомість слід очікувати чогось типу d-3, якщо ви покладете в регресію два параметри) і як можна уявити зменшення розмірів за допомогою ефективної оцінки. . Саме стаття Мура-Спрілла розробляє додаткові умови (потенційно збільшуючи ефективні ступені свободи) через цю неефективність, і саме моделювання Хосмера-Лемешоу показує, що d-2 працює найкраще. Ця теоретична робота далеко не інтуїтивно зрозуміла, а моделювання далеко не точне. Моя відповідь - це лише запитуване пояснення різниці з d-1.
Sextus Empiricus
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.