Спробую дати зрозуміле пояснення.
T-статистика * має чисельник і знаменник. Наприклад, статистика в одному зразку t-тесту є
x¯−μ0s/n−−√
* (їх декілька, але, сподіваємось, ця дискусія повинна бути достатньо загальною, щоб висвітлити ті, про кого ви питаєте)
За припущеннями чисельник має нормальний розподіл із середнім значенням 0 та деяким невідомим стандартним відхиленням.
За тим самим набором припущень знаменник - це оцінка стандартного відхилення розподілу чисельника (стандартна помилка статистики на чисельнику). Це незалежно від числівника. Його квадрат є випадковою змінною чи-квадрата, поділеною на її ступінь свободи (яка також є df розподілу t), .σnumerator
Коли ступеня свободи невелика, знаменник має тенденцію бути досить правим. У нього велика ймовірність бути меншою за середню, і порівняно хороший шанс бути зовсім невеликим. У той же час вона також має певний шанс бути набагато, значно більшою, ніж її середня.
За припущенням про нормальність чисельник та знаменник є незалежними. Отже, якщо ми виводимо випадковим чином з розподілу цієї t-статистики, ми маємо нормальне випадкове число, поділене на друге випадкове * обране значення від розподілу правого перекосу, яке в середньому становить близько 1.
* без огляду на звичайний термін
Оскільки це на знаменнику, малі значення при розподілі знаменника дають дуже великі t-значення. Правий косий в знаменнику роблять t-статистику важкохвостим. Правий хвіст розподілу, коли на знаменнику робить t-розподіл більш гострим, ніж нормальний, з тим же стандартним відхиленням, що і t .
Однак, коли ступеня свободи стає великою, розподіл стає набагато більш нормальним і набагато більш "щільним" навколо своєї середньої величини.
Як такий, ефект ділення знаменником на форму розподілу чисельника зменшується зі збільшенням ступенів свободи.
Врешті-решт, як може нам сказати теорема Слуцького, ефект знаменника стає більше схожим на ділення на константу і розподіл t-статистики дуже близький до нормального.
Розглядається з точки зору зворотного знаменника
У коментарях Уубер припустив, що дивитись на зворотний знаменник може бути більш ілюмінативно. Тобто, ми можемо записати нашу t-статистику як чисельник (нормальний) разів, зворотний знаменника (правий перекіс).
Наприклад, нашою статистикою з одного зразка-t вище:
n−−√(x¯−μ0)⋅1/s
Тепер розглянемо стандартне відхилення популяції від початкового , σ x . Ми можемо множити і ділити на нього так:Xiσx
n−−√(x¯−μ0)/σx⋅σx/s
Перший термін є нормальним. Другий член (квадратний корінь масштабованої зворотної чи-квадратної випадкової величини) потім масштабує це стандартне значення за величиною, що є більшим або меншим за 1, "поширюючи його".
За припущенням про нормальність, два терміни у творі є незалежними. Отже, якщо ми виводимо випадковим чином з розподілу цієї t-статистики, ми маємо нормальне випадкове число (перший додаток у творі), що кратне другому випадково вибраному значенню (без урахування нормального терміна) від розподілу правого перекосу, який є ' зазвичай 'близько 1.
Коли величина df велика, величина має тенденцію бути дуже близькою до 1, але коли df невелика, вона є досить перекошеною, а розкид - великим, при цьому великий правий хвіст цього коефіцієнта масштабування робить хвіст досить жирним: