@ Відповідь NRH на це запитання дає хороший простий доказ упередженості стандартного відхилення вибірки. Тут я чітко підрахую очікування стандартного відхилення вибірки (друге запитання оригінального афіші) від нормально розподіленого зразка, і в цей момент зміщення зрозуміло.
Дисперсія вибіркової вибірки набору точок єx1,...,xn
s2=1n−1∑i=1n(xi−x¯¯¯)2
Якщо звичайно розподілена, це фактxi
(n−1)s2σ2∼χ2n−1
де - справжня дисперсія. Розподіл має щільність ймовірностіσ2χ2k
p(x)=(1/2)k/2Γ(k/2)xk/2−1e−x/2
використовуючи це, ми можемо отримати очікуване значення ;s
E(s)=σ2n−1−−−−−√E(s2(n−1)σ2−−−−−−−−√)=σ2n−1−−−−−√∫∞0x−−√(1/2)(n−1)/2Γ((n−1)/2)x((n−1)/2)−1e−x/2 dx
що випливає з визначення очікуваного значення та факту, що - квадратний корінь розподіленої змінної . Підступність полягає в тому, щоб переставити терміни, щоб інтеграл став іншою щільністю :s2(n−1)σ2−−−−−−√χ2χ2
E(s)=σ2n−1−−−−−√∫∞0(1/2)(n−1)/2Γ(n−12)x(n/2)−1e−x/2 dx=σ2n−1−−−−−√⋅Γ(n/2)Γ(n−12)∫∞0(1/2)(n−1)/2Γ(n/2)x(n/2)−1e−x/2 dx=σ2n−1−−−−−√⋅Γ(n/2)Γ(n−12)⋅(1/2)(n−1)/2(1/2)n/2∫∞0(1/2)n/2Γ(n/2)x(n/2)−1e−x/2 dxχ2n density
тепер ми знаємо, що інтегранда останнього рядка дорівнює 1, оскільки це щільність . Спрощення констант трохи дає χ2n
E(s)=σ⋅2n−1−−−−−√⋅Γ(n/2)Γ(n−12)
Тому упередженість єs
σ−E(s)=σ(1−2n−1−−−−−√⋅Γ(n/2)Γ(n−12))∼σ4n
як .
n→∞
Не важко побачити, що це зміщення не дорівнює 0 для будь-яких кінцевих , таким чином, доведення вибіркового стандартного відхилення є упередженим. Нижче зміщення зображено графік як функція для червоного кольору, а синього:nnσ=11/4n