Чому Т-статистиці потрібні дані для нормального розподілу


11

Я дивився на цей зошит , і мене дивує це твердження:

Коли ми говоримо про нормальність, то ми маємо на увазі, що дані повинні виглядати як звичайний розподіл. Це важливо, оскільки на цьому покладаються кілька статистичних тестів (наприклад, t-статистика).

Я не розумію, навіщо T-статистиці потрібні дані для нормального розподілу.

Дійсно, Вікіпедія говорить те саме:

Т-розподіл студента (або просто t-розподіл) - це будь-який член сімейства безперервних розподілів ймовірностей, який виникає при оцінці середнього значення нормально розподіленого населення

Однак я не розумію, чому це припущення є необхідним.

Ніщо з його формули не вказує на те, що дані повинні слідувати нормальному розподілу:

введіть тут опис зображення

Я трохи роздивився його визначення, але не розумію, чому така умова необхідна.

Відповіді:


17

Інформація, яка вам потрібна, знаходиться у розділі "Характеристика" сторінки Вікі . -розподіл з ступенями свободи може бути визначена як розподіл випадкової величини таким чином, що де являє собою стандартний нормальний розподіл випадкова величина і - випадкова величина зі ступенями свободи . Крім того, і повинні бути незалежними. Отже, з огляду на будь-які і які відповідають наведеному вище визначенню, ви можете дійти до випадкової величини, яка має atνT

T=ZV/ν,
ZVχ2νZVZVt -розподіл.

Тепер припустимоX1,X2,,Xn розподіляється в відповідно до розподілу . Нехай F має середнє μ та дисперсію σ 2 . Нехай ˉ X - середня вибірка, а S 2 - дисперсія вибірки. Потім ми розглянемо формули:FFμσ2X¯S2

X¯μS/n=X¯μσ/n(n1)S2(n1)σ2.

FX¯N(μ,σ2/n)X¯μσ/nN(0,1)(n1)S2σ2χn12X¯S2tn1

Fχ2t


3
Мені завжди було цікаво, наскільки математичні технології входять у ці основоположні результати математичної статистики.
Меттью Друрі

3
X¯Sχ2

2

Я думаю, що може стати деяка плутанина між статистикою та її формулою, порівняно з розподілом та його формулою. Ви можете застосувати формулу t-статистики до будь-якого набору даних і отримати "t-статистику", але ця статистика не поширюватиметься відповідно до розподілу студент-t, якщо дані, отримані з звичайного розподілу (або, принаймні, не будуть гарантовано, є; я здогадуюсь, що ненормальні розподіли не дають розподілу студента-t, коли застосовується t-статистична формула, але я не впевнений у цьому). Причиною цього є просто те, що розподіл t-статистики обчислюється з розподілу даних, які його генерували, тому якщо у вас інший базовий розподіл, то вам не гарантується той самий розподіл для отриманих статистичних даних.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.