Стандартне відхилення стандартного відхилення


54

Що таке оцінка стандартного відхилення стандартного відхилення, якщо можна припустити нормальність даних?


Я припускаю, що ви шукаєте розподіл дисперсії вибірки . Це посилання на розділ на сторінці Вікіпедії про дисперсію 16:55, 21 серпня 2016 року. Оскільки це посилання на Вікіпедію, стаття може змінитися в майбутньому. Отже, розділ може не відображати змісту, на який посилається ця відповідь після таких змін. Тому тут подано посилання на історичну версію сторінки Вікіпедії. Поточну статтю про дисперсію можна знайти тут [ en

Відповіді:


58

Нехай . Як показано в цій нитці , стандартне відхилення вибіркового стандартного відхилення,X1,...,XnN(μ,σ2)

s=1n1i=1n(XiX¯),

є

SD(s)=E([E(s)s]2)=σ12n1(Γ(n/2)Γ(n12))2

де - гамма-функція , - розмір вибірки та - середнє значення вибірки. Оскільки є послідовним оцінником , це пропонує замінити на в рівнянні вище, щоб отримати послідовний оцінювач .Γ()nX¯=1ni=1nXisσσsSD(s)

Якщо це об'єктивний оцінювач, який ви шукаєте, ми бачимо в цій темі, що , що за лінійністю очікування підказуєE(s)=σ2n1Γ(n/2)Γ(n12)

sn12Γ(n12)Γ(n/2)

як неупереджений оцінювач . Все це разом з лінійністю очікування дає неупереджений оцінювач : σSD(s)

sΓ(n12)Γ(n/2)n12(Γ(n/2)Γ(n12))2

12
+1 Приємно бачити не лише кращу відповідь через майже два роки, але і відповідь, яка містить більш корисну деталь, ніж посилання в інших місцях у цій темі.
whuber

2
Ви забули квадратні відстані в першій формулі?
danijar

2
Функцію Gamma важко обчислити для не малих значень . Застосовуючи наближення Стірлінга, я отримую , що обчислювально можливо, як і трохи більш компактний вираз. nse(11n)n11
equaeghe

1
Напевно, варто зазначити, що s (обчислюється у відповіді @
Макроса

Для тих, хто хоче просту форму, є хорошим наближенням на рівні декількох відсотків. s/2(n1)
Сиртіс-майор

5

Припустимо, ви спостерігаєте iid від нормалі із середнім нулем та дисперсією . Стандартне відхилення (емпіричне) - квадратний корінь оцінювача з (неупереджений чи ні, це не питання). Оцінювач (отриманий з ), має дисперсію, яку можна обчислити теоретично. Можливо, те, що ви називаєте стандартним відхиленням стандартного відхилення, є насправді квадратним коренем дисперсії стандартного відхилення, тобто ? Це не оцінювач, це теоретична величина (щось на зразокX1,,Xnσ2σ^2σ2X1,,Xnσ^E[(σσ^)2]σ/n підтверджується), що можна обчислити експліцитно!


Хіба не те, що функція оцінювача все ще є оцінкою? Я досі не знаю \ sigma, тільки X_i.

ок, тоді ви, можливо, оціните квадратний корінь дисперсії оцінки квадратного кореня дисперсії ... правда :) має бути щось на зразок ? σ^/n
Робін Жирард

Те, що знайшов Срікант (і що, здається, підтверджено на PhysicsForums), має бути , тож швидше . 2σ^22n

1
Aww, ці коментарі блокуються; . Принаймні, це дає результат у згоді з завантажувальним інструментом. σ^2n

-3

@Macro дав чудове математичне пояснення з рівнянням для обчислення. Ось більш загальне пояснення для менш математичних людей.

Я думаю, що термінологія "СД SD" для багатьох бентежить. Простіше думати про довірчий інтервал SD. Наскільки точним є стандартне відхилення, яке ви обчислюєте від вибірки? Випадково вам може трапитися отримання даних, які тісно з'єднані між собою, що робить вибірку SD значно нижчою, ніж SD населення. Або, можливо, ви отримали випадкові значення, які набагато більше розсіяні, ніж загальна сукупність, що робить вибірку SD вищою, ніж SD населення.

Інтерпретація ІС СД є простою. Почніть зі звичного припущення, що ваші дані були вибірково вибірені незалежно від розподілу Гаусса. Тепер повторіть цю вибірку багато разів. Ви очікуєте, що 95% цих довірчих інтервалів включатимуть справжній рівень населення.

Наскільки широкий довірчий інтервал 95% SD? Це, звичайно, залежить від розміру вибірки (n).

n: 95% ІС SD

2: 0,45 * SD до 31,9 * SD

3: 0,52 * SD до 6,29 * SD

5: 0,60 * SD до 2,87 * SD

10: 0,69 * SD до 1,83 * SD

25: 0,78 * SD до 1,39 * SD

50: 0,84 * SD до 1,25 * SD

100: 0,88 * SD до 1,16 * SD

500: 0,94 * SD до 1,07 * SD

Безкоштовний веб-калькулятор


Я можу зробити Монте-Карло, я просто хотів це зробити більш «науково»; все-таки ви маєте рацію, що розподіл не є нормальним, тому цей sd буде марний для тестування.

4
Мені незрозуміло твердження "інтервал довіри, який становить 95% ... ймовірно, міститиме справжній SD" (або, сказано більш чітко, на пов'язаній сторінці: "Ви можете бути на 95% впевнені, що CI, обчислений на вибірці SD, містить справжній SD "). Я думаю, що ці твердження фліртують із посиленням помилкового уявлення, дивіться тут , наприклад, для пов'язаної дискусії з резюме.
gung - Відновіть Моніку

5
Що таке: "Я думаю, що і поняття, і термінологія" СД SD "є занадто слизьким, щоб вирішити", що повинно означати? Стандартне відхилення вибірки - випадкова величина, яка має стандартне відхилення.
Макрос

@Macro Дякуємо за ваші коментарі. Я переписав істотно.
Харві Мотульський

1
@gung. Я переписав, щоб правильно пояснити інтервал довіри.
Харві Мотульський
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.