Чи побудовано використання стандартного відхилення на припущенні нормального розподілу?


10

Мені цікаво, чи завжди стандартне відхилення будувалося на припущенні про нормальний розподіл. Іншими словами, якщо вибірка нормально не розподіляється, чи слід вважати використання стандартного відхилення помилкою?


3
Рівномірний розподіл має стандартне відхилення, як це могло бути "помилкою"?

Відповіді:


18

Ні. Використання стандартного відхилення не передбачає нормальності.

Варіантність випадкової величини визначається як . Поки існує дисперсія, існує і стандартне відхилення. Стандартне відхилення - квадратний корінь дисперсії.Var(X)=E[(XE[X])2]

Ви можете використовувати дисперсію ім'я або стандартне відхилення будь-коли, коли вони існують. Варіант виникає у незліченних ситуаціях.Var(X)

Існують спеціальні теореми, леми тощо ... хоча для особливого випадку, коли слід нормального розподілу.X

Загальне використання стандартного відхилення, яке дійсно залежить від нормальності:

Якщо слідує за нормальним розподілом, то приблизно 95% ймовірність того, що потрапить у межах двох стандартних відхилень середнього значення.XX

Це твердження вірно, якщо слідує за нормальним розподілом (та декількома іншими), але це неправда взагалі.X

Загальне використання дисперсії, яка не залежить від нормальності:

Нехай - випадкова величина із середнім та дисперсією ім'ям . Визначимо для , як незалежних випадкових величин, кожна з наступного за однаковим розподілом як .XE[X]=μVar(X)=σ2Xii=1,,nX

Визначте середнє значення вибірки на основі спостережень як: n

X¯n=1ni=1nXi

За теоремою центрального граничного значення сходиться до нормально розподіленої випадкової величини із середнім та дисперсією . (Точніше перетворюється в розподілі до як .)X¯nμσ2nn(X¯nμ)N(0,σ2)n

Практичним наслідком є те, що вибіркове середнє при великих можна розглядати як нормально розподіленої випадкової змінної, дисперсія є функцією дисперсії . (Згадайте ім'я ) І цей результат не вимагає, щоб був нормальним. (Потрібно, щоб нижня працювала добре, якщо в деякому сенсі ближче до нормального розподілу.)X¯nnσ2nXVar(X)=σ2XnX

Теорема центрального ліміту є всюдисущим інструментом, який використовує дисперсію і не потребує щоб слідкувати за нормальним розподілом.XX


4
Нерівність Чебишева не характерна для дисперсії: однаково корисна версія існує для кожного абсолютного моменту з потужністю більше . Тому я б запропонував шукати в іншому місці причини, чому СД важлива і (майже) універсальна, наприклад, унікальна роль, яку відіграє дисперсія в теоремі про центральний межа. 1
whuber

@whuber Так, я почав писати приклад CLT (і тепер я додав його). CLT - це надзвичайно практичний привід піклуватися про дисперсію.
Меттью Ганн

1
+1. Але зауважте, що хоча дисперсія (разом із середнім значенням) дає повний опис у звичайному випадку, для ненормального розподілу це вже не може бути, а інші d3scriptor даних можуть бути набагато кращими
kjetil b halvorsen

2

У стандартній установці IID за відповідних умов регулярності (а також ) є сильно послідовним оцінником . Це випливає безпосередньо із Сильного закону великих чисел. Нормальне припущення про модель не потрібно.S2σ^ML2Var[Xi]

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.