Папір Пірсона 1900 року поза авторським правом, тому ми можемо читати її в Інтернеті .
Спершу слід зауважити, що ця стаття стосується тесту на придатність, а не про перевірку незалежності чи однорідності.
Він протікає, працюючи з багатоваріантним нормальним, і ква-квадрат виникає як сума квадратних стандартизованих нормальних величин.
Ви можете бачити з дискусії на p160-161, що він чітко обговорює застосування тесту до мультиноміальних розподілених даних (я не думаю, що він десь використовує цей термін). Він, мабуть, розуміє приблизну багатоваріантну нормальність мультиноміалу (звичайно, він знає, що граничні показники приблизно нормальні - це дуже старий результат - і знає засоби, відхилення та коваріації, оскільки вони вказані в роботі); я здогадуюсь, що більшість цих речей вже є старовинним капелюхом до 1900 року. (Зауважимо, що сам розподіл у квадраті датується Гельмертром у середині 1870-х рр.)
Потім в нижній частині p163 він отримує статистику хі-квадрата як «міру корисності придатності» (сама статистика фігурує в показнику багатоваріантного нормального наближення).
Потім він продовжує обговорювати, як оцінити р-значення *, а потім правильно надає верхню площу хвоста за межі 43,87 як 0,000016. [Однак слід пам’ятати, що він неправильно розумів, як відрегулювати ступінь свободи для оцінки параметрів на цьому етапі, тому деякі приклади в його роботах використовують занадто високий df]χ212
* (зауважте, що ні парадигми тестування Фішера, ні Неймана-Пірсона, ми все-таки чітко бачимо, як він вже застосовує поняття p-значення.)
Ви зауважите, що він не пише явно таких термінів, як . Натомість він пише m 1 , m 2 тощо для очікуваних підрахунків, а для спостережуваних величин він використовує m ′ 1(Oi−Ei)2/Eim1m2m′1 тощо. Потім він визначає (нижня половина p160) і обчислює e 2 / m для кожної комірки (див. Екв. (Xv) p163 та останній стовпець таблиці в нижній частині p167) ... еквівалентні величини, але в різних позначеннях.e=m−m′e2/m
Значна частина теперішнього способу розуміння тесту чи-квадрата ще не встановлена, але, з іншого боку, вже зовсім небагато (принаймні, якщо ви знаєте, на що звернути увагу). У 1920-х роках (і далі) багато трапилось, що змінило наш погляд на ці речі.
Що стосується того, чому ми поділяємо на у мультиноміальному випадку, буває, що хоча дисперсія окремих компонентів у мультиноміалі менша, ніж E i , коли ми враховуємо коваріації, це рівнозначно діленню на E i , роблячи для приємного спрощення.EiEiEi
Додано в редагуванні:
Документ Плакетта про 1983 рік містить багато історичного контексту, а також щось керівництво до цього документу. Я настійно рекомендую поглянути на це. Схоже, це безкоштовно в Інтернеті через JStor (якщо ви входите в систему), тому вам навіть не потрібен доступ через установу, щоб прочитати його.
Plackett, RL (1983),
"Карл Пірсон і тест Chi-Squared",
Міжнародний статистичний огляд ,
Vol. 51, № 1 (квітень), стор 59-72