t-розподіл, що має важчий хвіст, ніж звичайний розподіл


10

У моїх лекційних записках написано:

t-розподіл виглядає нормально, хоча і з трохи важчими хвостами.

Я розумію, чому це виглядало б нормально (через теорему про центральний межа). Але мені важко зрозуміти, як математично довести, що у нього важчі хвости, ніж у звичайного розподілу, і чи є спосіб виміряти, наскільки це важче, ніж звичайне.

Відповіді:


12

Перше, що потрібно зробити - це формалізувати те, що ми маємо на увазі під «важчим хвостом». Можна умовно подивитися, наскільки висока щільність у крайньому хвості після стандартизації обох розподілів, щоб вони мали однакове розташування та масштаб (наприклад, стандартне відхилення):

введіть тут опис зображення
цієї відповіді, яка також дещо відповідає вашому питанню )

[У цьому випадку масштабування насправді не має значення; t все одно буде "важчим", ніж нормальний, навіть якщо ви використовуєте дуже різні масштаби; нормальний завжди знижується]

Однак це визначення - хоча воно працює нормально для цього конкретного порівняння - не дуже узагальнює.

Більш загальне визначення тут набагато кращого визначення у відповіді Валера . Тож якщо важче хвоста, ніжYХ, як т стає достатньо великим (для всіх т> дещо т0), тоді SY(т)>SХ(т), де S=1-Ж, де Ж - це cdf (для більш важких хвостів справа; з іншого боку є подібне, очевидне визначення).

введіть тут опис зображення

Ось це і в лог-шкалі, і в квантильній шкалі нормальної, що дозволяє нам побачити більше деталей:

введіть тут опис зображення

Тож тоді "доказ" більш важкої хвостивості передбачає порівняння cdfs та показує, що верхній хвіст t-cdf зрештою завжди лежить вище норми, а нижній хвіст t-cdf з часом завжди лежить нижче норми.

У цьому випадку найпростіше зробити порівняння густин, а потім показати, що відповідне відносне положення cdfs (/ функції виживання) повинно випливати з цього.

Так, наприклад, якщо ви можете це заперечити (у деяких даних ν)

х2-(ν+1)журнал(1+х2ν)>2журнал(к)

для необхідної постійної к (функція ν), для усіх х> дещо х0, тоді можна було б встановити важчий хвіст для тν також щодо визначення з точки зору більшого 1-Ж (або більше) Ж з лівого хвоста).

(ця форма випливає з різниці журналу густин, якщо це відповідає необхідному співвідношенню між щільністю)

[Насправді це можна показати будь-якому к (а не лише конкретна, яка нам потрібна, від відповідних констант, що нормалізують щільність), тому результат повинен мати значення для к нам потрібно.]


1
Графік с logS(x) (і, можливо, розширюється хтрохи) може чіткіше демонструвати важчі хвости, а також може працювати з більш високими ступенями свободи,
Генрі

1
@Henry Я створив такий сюжет, але не знав, яку величину він додав, тому я не включав його. Я подумаю над тим, як це зробити.
Glen_b -Встановіть Моніку

1
@ Генрі Я включив сюжет.
Glen_b -Встановити Моніку

2

Один із способів побачити різницю - це використання моментів Е{хн}.

"Важкі" хвости означатимуть більш високі значення для рівних моментів потужності (потужність 4, 6, 8), коли дисперсія однакова. Зокрема, момент 4-го порядку (навколо нуля) називається куртозом і порівнює в певному сенсі важкість хвостів.

Докладніше див. У Вікіпедії ( https://en.wikipedia.org/wiki/Kurtosis )


1
Хоча для а т-розподіл с 3 або 4 ступенів свободи, куртоз нескінченний, тоді як с 2 градусів свободи, стандартне відхилення нескінченне, тому ви не можете обчислити куртоз, і с 1 ступінь свободи, яку ви навіть не можете обчислити середньою або середньою 4-й момент.
Генрі

3
@Henry Тим не менш, ця ідея хороша. Розширення CDF студентат(ν) розподіл навколо + показує, що вона асимптотично пропорційна х-ν. При цьому всі абсолютні моменти ваги менше, ніжν існують і всі абсолютні моменти ваги більше, ніж νрозходяться. При нормальному розподілі існують усі абсолютні моменти. Це забезпечує чітке впорядкування хвостів усього Студентатрозподілів і нормального розподілу. Фактично параметрνдає одну відповідь на вихідне питання про те, як виміряти важкість хвоста.
whuber

2

Ось офіційний доказ на основі функцій виживання. Я використовую таке визначення "важчий хвіст", натхненний wikipedia :

Випадкова величина Y з функцією виживання Sу(т) має більш важкі хвости, ніж випадкова величина Х з функцією виживання Sх(т) iff

limтSу(т)Sх(т)=

Розглянемо випадкову змінну Y розподіляється як t студента зі середнім нулем, ступенями свободи ν і параметр масштабу а. Ми порівнюємо це зі випадковою змінноюХN(0,σ2). Для обох змінних функції виживання диференційовані. Тому

limтSу(т)Sх(т)=limтfу(т)fх(т)=досвідlimт(журналfу(т)-журналfх(т))=досвідlimт(-ν+12журнал(1+т2νа2)-(-12σ2т2)+С)=досвід(limт-ν+12журнал(1+т2νа2)-(-12σ2т2)+С)=досвід(limт12σ2т2-ν+12журнал(1+т2νа2)+С)=досвід(12limуа2σ2у-(ν+1)журнал(1+уν)+С)=досвід(12limуу(а2σ2-(ν+1)журнал(1+уν)у+Су))
Де ми підставили у=т2/а2. Зауважте, що0<а2/σ2< є постійною, limуС/у=0 і
limу(ν+1)журнал(1+уν)у=limу(ν+1)(1)(1+уν)(ν)=0
Звідси по алгебраїчній граничній теоремі,
limтSу(т)Sх(т)=досвід(12limуу(а2σ2-(0)+(0)))=

Важливо, що результат має місце для довільних (кінцевих) значень а, σ2, і ν, тож у вас можуть виникнути ситуації, коли при розподілі є менша дисперсія, ніж у звичайного, але все ж мають більш важкі хвости.


1
Лише зауважте, що таке "визначення" важчих хвостів не завжди прийнятне. Наприклад, розподіл N (0,1) за цим визначенням має більш важкі хвости, ніж розподіл .9999 * U (-1,1) + .0001 * U (-1000, 1000), хоча останній розподіл виробляє періодичні значення до 175 стандартних відхилень від середнього значення, незважаючи на обмежену підтримку. Звичайно, N (0,1) також дає такі значення, але з ймовірністю набагато нижче того, що можна вважати актуальним для практичних цілей.
Пітер Вестпад
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.