Чому стандартне відхилення вибірки є упередженим оцінювачем ?


57

Згідно зі статтею Вікіпедії про неупереджене оцінювання стандартного відхилення, зразок SD

s=1n1i=1n(xix¯)2

є упередженим оцінювачем СД населення. У ньому зазначено, що .E(s2)E(s2)

NB. Випадкові змінні незалежні і кожнаxiN(μ,σ2)

Моє запитання двояке:

  • Що є доказом упередженості?
  • Як можна обчислити очікування стандартного відхилення вибірки

Мої знання з математики / статистики лише проміжні.


4
Ви знайдете відповіді на обидва запитання у статті Вікіпедії про розповсюдження Chi .
whuber

Відповіді:


57

@ Відповідь NRH на це запитання дає хороший простий доказ упередженості стандартного відхилення вибірки. Тут я чітко підрахую очікування стандартного відхилення вибірки (друге запитання оригінального афіші) від нормально розподіленого зразка, і в цей момент зміщення зрозуміло.

Дисперсія вибіркової вибірки набору точок єx1,...,xn

s2=1n1i=1n(xix¯)2

Якщо звичайно розподілена, це фактxi

(n1)s2σ2χn12

де - справжня дисперсія. Розподіл має щільність ймовірностіσ2χk2

p(x)=(1/2)k/2Γ(k/2)xk/21ex/2

використовуючи це, ми можемо отримати очікуване значення ;s

E(s)=σ2n1E(s2(n1)σ2)=σ2n10x(1/2)(n1)/2Γ((n1)/2)x((n1)/2)1ex/2 dx

що випливає з визначення очікуваного значення та факту, що - квадратний корінь розподіленої змінної . Підступність полягає в тому, щоб переставити терміни, щоб інтеграл став іншою щільністю :s2(n1)σ2χ2χ2

E(s)=σ2n10(1/2)(n1)/2Γ(n12)x(n/2)1ex/2 dx=σ2n1Γ(n/2)Γ(n12)0(1/2)(n1)/2Γ(n/2)x(n/2)1ex/2 dx=σ2n1Γ(n/2)Γ(n12)(1/2)(n1)/2(1/2)n/20(1/2)n/2Γ(n/2)x(n/2)1ex/2 dxχn2 density

тепер ми знаємо, що інтегранда останнього рядка дорівнює 1, оскільки це щільність . Спрощення констант трохи дає χn2

E(s)=σ2n1Γ(n/2)Γ(n12)

Тому упередженість єs

σE(s)=σ(12n1Γ(n/2)Γ(n12))σ4n
як .n

Не важко побачити, що це зміщення не дорівнює 0 для будь-яких кінцевих , таким чином, доведення вибіркового стандартного відхилення є упередженим. Нижче зміщення зображено графік як функція для червоного кольору, а синього:nnσ=11/4n

введіть тут опис зображення


(+1) Приємна відповідь. Я сподіваюся, що ви не заперечуєте, я переробив декілька дуже незначних речей і додав асимптотичний результат щодо зміщення. Я припускаю, що ви могли накласти криву на свою ділянку, але це, мабуть, непотрібно. Ура. :)(4n)1
кардинал

Ви дійсно пішли на багато болю, щоб зробити цей Макрос. Коли я вперше побачив пост близько хвилини тому, я думав показати упередженість за допомогою правила Дженсена, але хтось уже це зробив.
Майкл Черник

2
Звичайно, це спосіб, який показує, що стандартне відхилення є упередженим - я головним чином відповідав на друге питання оригінального плаката: "Як можна обчислити очікування стандартного відхилення?".
Макрос

2
Ще один момент, який, мабуть, варто згадати, полягає в тому, що цей обчислення дозволяє негайно зчитувати те, що оцінювач UMVU стандартного відхилення є у випадку Гаусса: Один просто множить на зворотний коефіцієнт масштабу, який відображається в доказі. Це досить легко узагальнює обчислювачі UMVU . sσk
кардинал

2
Вибачте, Макрос. Працює той самий базовий інтегральний підхід, який ви використовували, ви просто закінчите інший масштабуючий коефіцієнт , з аргументами гами ви отримаєте функції . Це я мав на увазі, але вийшло трохи надто лаконічно. :)skk
кардинал

43

Вам не потрібна нормальність. Все, що вам потрібно, це те, що - неупереджений оцінювач дисперсії . Тоді використовуйте, що функція квадратного кореня суворо увігнута таким чином, що (сильною формою нерівності Дженсена ) якщо розподіл вироджується при .

s2=1n1i=1n(xix¯)2
σ2
E(s2)<E(s2)=σ
s2σ2

19

Доповнюючи відповідь NRH, якщо хтось навчає це групі студентів, які ще не вивчали нерівності Дженсена, одним із способів є визначення вибіркового стандартного відхилення припустимо, що не є виродженим (отже, ), і помітіть еквівалентність

Sn=i=1n(XiX¯n)2n1,
SnVar[Sn]0
0<Var[Sn]=E[Sn2]E2[Sn]E2[Sn]<E[Sn2]E[Sn]<E[Sn2]=σ.
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.