Питання про припущення щодо нормальності t-тесту


9

Для t-тестів, згідно з більшістю текстів, існує припущення, що дані популяції зазвичай розподіляються. Я не бачу, чому це так. Чи не вимагає тестового тесту лише те, щоб розподіл вибірки засобів для вибірки був нормально розподілений, а не популяція?

Якщо у випадку, якщо t-тест в кінцевому підсумку вимагає нормальності розподілу вибірки, сукупність може виглядати як будь-яке розподілення, правда? Поки є розумний розмір вибірки. Хіба це не те, про що йдеться в центральній граничній теоремі?

(Я маю на увазі тут одновибічні або незалежні t-тести зразків)


1
Ну, середнє значення вибірки як випадкова величина може бути нормальним лише тоді, коли окремі частини також є нормальними. Але ви маєте рацію: t-тест є асимптотично непараметричним (нормальне розподіл не має), але все-таки відхилення в групі (у ситуації з двома вибірками) повинні бути подібними та існуючими.
Майкл М

Якщо подібні відхилення в межах групи, ви маєте на увазі припущення про однорідність дисперсії? Якщо так, то тест Welch для цього правильний, правильно?
Пітер Наш

Так, саме. Якщо виправлена ​​ступінь свободи Велча перейде до нескінченності, то і його процедура була б безкоштовною (проте потрібне цитування ...).
Майкл М

Відповіді:


9

Для t-тестів, згідно з більшістю текстів, існує припущення, що дані популяції зазвичай розподіляються. Я не бачу, чому це так. Чи не вимагає тестового тесту лише те, щоб розподіл вибірки засобів для вибірки був нормально розподілений, а не популяція?

T-статистика складається з співвідношення двох величин, обох випадкових величин. Він складається не лише з чисельника.

Щоб t-статистика мала t-розподіл, потрібно не просто те, щоб середнє значення вибірки мало нормальний розподіл. Вам також потрібно:

  • щоб в знаменнику був таким, що *ss2/σ2χd2

  • щоб чисельник і знаменник були незалежними.

* (значення залежить від того, який тест - в одному зразку маємо )dtd=n1

Щоб ці три речі справді були правдивими, потрібно, щоб вихідні дані були нормально розподілені.

Якщо у випадку, якщо t-тест в кінцевому підсумку вимагає нормальності розподілу вибірки, сукупність може виглядати як будь-яке розподілення, правда?

Давайте візьмемо iid, як дано на мить. Для утримання CLT населення повинно відповідати умовам ... - населення має мати розподіл, до якого застосовується CLT. Так ні, оскільки є розподіли населення, до яких CLT не застосовується.

Поки є розумний розмір вибірки. Хіба це не те, про що йдеться в центральній граничній теоремі?

Ні, CLT насправді не говорить жодного слова про "розумний розмір вибірки".

Він насправді нічого не говорить про те, що відбувається при будь-яких обмежених розмірах вибірки.

Я зараз думаю про конкретний розподіл. Це той, до якого звичайно застосовується CLT . Але при розподіл середнього зразка явно ненормований. Але я сумніваюся, що будь-який зразок в історії людства коли-небудь мав у ньому стільки цінностей. Отже - поза тавтологією - що означає «розумний »?n=1015n


Отже, у вас є проблеми-близнюки:

A. Ефект, який люди зазвичай приписують CLT - все більш близький підхід до нормальності розподілу засобів вибірки при малих / помірних розмірах вибірки - насправді не зазначається в CLT **.

B. "Щось не так далеко від нормального в чисельнику" недостатньо, щоб отримати статистику, що має t-розподіл

** (Щось на кшталт теореми Беррі-Ессена ви більше схожі на те, що бачать люди, дивлячись на ефект збільшення розміру вибірки на розподіл засобів вибірки.)


CLT і теорема Слуцького разом дають вам (доки всі їхні припущення дотримуються), що як , то розподіл t-статистики наближається до нормального нормального. Це не говорить про те, чи може бути якесь задане кінцеве достатньо для певної мети.nn


1
Для цих трьох речей [нормальність середньої вибірки, чі-квадратність дисперсії вибірки та незалежність обох] насправді є необхідними, потрібно, щоб вихідні дані були нормально розподілені. Ви хочете сказати, що лише Нормальний має ці три властивості? Я не стверджую, що твердження неправдиве, просто цікаво, якщо це ви говорите.
Ендрю М

2
@AndrewM Безумовно, тільки нормальний має всі три разом. Крім того, першого або третього достатньо лише для того, щоб мати на увазі нормальне - третє характеризує нормальне ( Лукач, 1942 ), а для кінцевих чисел незалежних випадкових величин лише норма має першу ( теорема про розпад Крамера ). Цілком можливо, що є якийсь інший спосіб отримати другий, але я не знаю одного.
Glen_b -Встановіть Моніку

@AndrewM щодо другого, праця Ахсанулла (1987,1989) може бути актуальною.
Glen_b -Встановіть Моніку

1
Дякую за ці посилання @Glen_b! Мені не було відомо про результат Лукача, і теорема про декомпозицію Крамера, як заявлено, є досить сильнішою, ніж версія, яку я мав у верхній частині голови ( Normal iffXAX Normal, для всіх матрицьA).
Андрій М

@AndrewM Різниця в тому, що ви цитуєте результат, не покладається на незалежність, в той час як результат Крамера. Вони обоє корисні на своєму місці.
Glen_b -Встановіть Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.