благість-оф-придатний тест використовує наступну статистику : У тесті, враховуючи , що умови виконані, як використовуються - розподіл для обчислення р-значення, враховуючи правда можна було б спостерігати таке значення в репрезентативній вибірці одного і того ж розміру.χ 2 0 = n ∑ i = 1 ( O i - E i ) 2
Однак для того, щоб статистика слідувала за (з ступенями свободи), повинно бути правдою, що:
- Зразок представника населення
- Великий розмір зразка
- Очікувана кількість клітин досить велика
- Незалежність між кожною категорією
З умов (1,2) видно, що ми задовольняємо умовам для виведення з вибірки до сукупності. (3), здається, потрібне припущення, оскільки дискретний підрахунок , який знаходиться в знаменнику, не призводить до майже безперервного розподілу для кожного і якщо він недостатньо великий, виникає помилка, яку можна виправити за допомогою Yates «виправлення - це, мабуть, пов’язано з тим, що дискретний розподіл є в основному безперервним« поворотним », тому зсув на для кожного виправляє це.
Здається, необхідність (4) пізніше стане в нагоді, але я не можу зрозуміти як.
Спочатку я подумав, що необхідний, щоб статистика відповідала розподілу. Це мене до сумнівного припущення, що , що було дійсно неправильним. Насправді, із зменшення розмірності для двох сторін рівності від до , це не може бути так. Oi-Ei∼N(0,√nn-1
Завдяки поясненням стало очевидним, що не потрібно дорівнювати кожному оскільки (відзначимо зменшення кількості підсумованих змінних) для стандартних нормальних випадкових величин які функціонально незалежні.O i - E i χ20=∑n-1i=1Z2iZi
моє запитання : як може слідувати розподілу ? Які види комбінацій кожного з доданків призводять до квадратних стандартних нормалей ? Це вимагає використання CLT, мабуть (і це має сенс), але як? Іншими словами , чому кожен дорівнює (або приблизно дорівнює)? χ 2 ( O i - E i ) 2 Z 2 i Zi