Після нещодавнього голосування за відмову я намагався перевірити своє розуміння тесту Пірсона на квадрат. Зазвичай я використовую статистику хі-квадрата (або зменшену статистику чи-ква) для підгонки або перевірки отриманої придатності. У цьому випадку дисперсія зазвичай не є очікуваною кількістю підрахунків у таблиці чи гістограмі, а деякою експериментально визначеною дисперсією. Так чи інакше, я завжди мав враження, що тест все ще використовував асимптотичну нормальність багаточленного PDF (тобто моя тестова статистика:
і є асимптотично багатонормальним, де V - матриця коваріації). Тому Q має розподіл у квадраті чи великим n, тому використання очікуваної кількості підрахунків як знаменника в статистиці стає дійсним для великих n . Можливо, що це справедливо лише для гістограм, я не аналізував невелику таблицю даних за роки.
Чи є більш тонкий аргумент, який я пропускаю? Мене зацікавила б посилання, а ще краще коротке пояснення. (Хоча це можливо, я щойно проголосував за те, щоб пропустити слово асимптотичне, що, я визнаю, є досить важливим.)