Як Карл Пірсон придумав статистику хі-квадрата?


14

Як Пірсон придумав наступну статистику Pearson-хі-квадрата в 1900 році?

K=(OijEij)2Eij
що
Kχ2

Чи мав він на увазі чи-квадрат і розробив метрику (підхід знизу вгору), або він розробив статистику і пізніше довів, що вона відповідає розподілу chi-квадрата (зверху вниз)?K

Я хочу знати, чому він обрав таку конкретну форму, а не інші, такі як або, а також чому він розділив квадрат зі знаменником.| O i j - E i j |(OijEij)2|OijEij|



1
Звичайно, можна мати будь-яку кількість статистичних даних, якими ви можете скористатися. Ваші альтернативи є прекрасними, хоча вам доведеться розробити вибіркові розподіли для них, які залежать від кількості осередків. Одне, що є зручним у цій формі, - це те, що вона має певні відносини до інших розподілів, наприклад, це розподіл суми k квадратних стандартних звичайних випадкових величин.
gung - Відновіть Моніку

Відповіді:


23

Папір Пірсона 1900 року поза авторським правом, тому ми можемо читати її в Інтернеті .

Спершу слід зауважити, що ця стаття стосується тесту на придатність, а не про перевірку незалежності чи однорідності.

Він протікає, працюючи з багатоваріантним нормальним, і ква-квадрат виникає як сума квадратних стандартизованих нормальних величин.

Ви можете бачити з дискусії на p160-161, що він чітко обговорює застосування тесту до мультиноміальних розподілених даних (я не думаю, що він десь використовує цей термін). Він, мабуть, розуміє приблизну багатоваріантну нормальність мультиноміалу (звичайно, він знає, що граничні показники приблизно нормальні - це дуже старий результат - і знає засоби, відхилення та коваріації, оскільки вони вказані в роботі); я здогадуюсь, що більшість цих речей вже є старовинним капелюхом до 1900 року. (Зауважимо, що сам розподіл у квадраті датується Гельмертром у середині 1870-х рр.)

Потім в нижній частині p163 він отримує статистику хі-квадрата як «міру корисності придатності» (сама статистика фігурує в показнику багатоваріантного нормального наближення).

Потім він продовжує обговорювати, як оцінити р-значення *, а потім правильно надає верхню площу хвоста за межі 43,87 як 0,000016. [Однак слід пам’ятати, що він неправильно розумів, як відрегулювати ступінь свободи для оцінки параметрів на цьому етапі, тому деякі приклади в його роботах використовують занадто високий df]χ122

* (зауважте, що ні парадигми тестування Фішера, ні Неймана-Пірсона, ми все-таки чітко бачимо, як він вже застосовує поняття p-значення.)

Ви зауважите, що він не пише явно таких термінів, як . Натомість він пише m 1 , m 2 тощо для очікуваних підрахунків, а для спостережуваних величин він використовує m 1(OiEi)2/Eim1m2m1 тощо. Потім він визначає (нижня половина p160) і обчислює e 2 / m для кожної комірки (див. Екв. (Xv) p163 та останній стовпець таблиці в нижній частині p167) ... еквівалентні величини, але в різних позначеннях.e=mme2/m

Значна частина теперішнього способу розуміння тесту чи-квадрата ще не встановлена, але, з іншого боку, вже зовсім небагато (принаймні, якщо ви знаєте, на що звернути увагу). У 1920-х роках (і далі) багато трапилось, що змінило наш погляд на ці речі.


Що стосується того, чому ми поділяємо на у мультиноміальному випадку, буває, що хоча дисперсія окремих компонентів у мультиноміалі менша, ніж E i , коли ми враховуємо коваріації, це рівнозначно діленню на E i , роблячи для приємного спрощення.EiEiEi


Додано в редагуванні:

Документ Плакетта про 1983 рік містить багато історичного контексту, а також щось керівництво до цього документу. Я настійно рекомендую поглянути на це. Схоже, це безкоштовно в Інтернеті через JStor (якщо ви входите в систему), тому вам навіть не потрібен доступ через установу, щоб прочитати його.

Plackett, RL (1983),
"Карл Пірсон і тест Chi-Squared",
Міжнародний статистичний огляд ,
Vol. 51, № 1 (квітень), стор 59-72


1
Я просто перечитую цю публікацію, і кожен раз, коли я це роблю, я отримую додаткове розуміння. @Glen_b Я хочу подякувати за чудову відповідь, яку я мав би робити раніше. Якщо я можу задати додаткове запитання, у вашому поясненні того, як поділ на E регулює коваріантність, чи можете ви детальніше розібратися з цим питанням або вказати мені на ресурс, який обговорює цю тему? Я інтуїтивно можу зрозуміти, для чого потрібна «нормалізація», але я хочу підкріпити свою інтуїцію математичним доказом.
Елбі

1
Ei

1
XiCov(Xi,Xj)=E(XiXj)E(Xi)E(Xj)=E(Xi)E(Xj)Xi,Xj>0Cov(Oi,Oj)

Дякуємо за посилання @Glen_b. Прочитавши пост, зараз це набагато зрозуміліше! Я наївно думав, що в знаменнику є коригування початкових відмінностей для кожної комірки, таким чином, термін "нормалізується", але, читаючи вашу публікацію, я зрозумів, що повністю відзначився.
Альбі

На жаль, слово "нормалізувати" має щонайменше три різні сенси, що мають відношення до статистики. Ненаголошений, я зазвичай використовую його лише для позначення "стандартизувати до значення 0 та стандартного відхилення 1", але інші люди використовують це для "нормалізації" у сенсі нормалізації вектора за якоюсь нормою, або навіть для перетворення на приблизну нормальність. Оскільки це така жучка тут, я маю знати до цього часу, щоб її уникнути.
Glen_b -Встановити Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.