Вивчити дисперсію важко.
Для оцінки дисперсії в багатьох випадках потрібно (можливо, дивно) велика кількість зразків. Нижче я покажу розробки для "канонічного" випадку звичайного зразка iid.
Нехай , i = 1 , … , n є незалежними N ( μ , σ 2 ) випадковими змінними. Шукаємо 100 ( 1 - α ) % довірчого інтервалу для дисперсії таким чином, що ширина інтервалу дорівнює ρ s 2 , тобто ширина становить 100 ρ % бальної оцінки. Наприклад, якщо ρ = 1 / 2 , то ширина CI дорівнює половині значення оцінки точки, наприклад, якщоYii=1,…,nN(μ,σ2)100(1−α)%ρs2100ρ%ρ=1/2 , тоді CI був би на кшталт ( 8 ,s2=10 , що має ширину 5. Зверніть увагу і на асиметрію навколо точкової оцінки. ( s 2 - неупереджений оцінювач для дисперсії.)(8,13)s2
Довірчий інтервал "(", швидше, "а") для дорівнює
( n - 1 ) s 2s2
де χ 2
(n−1)s2χ2(1−α/2)(n−1)≤σ2≤(n−1)s2χ2(α/2)(n−1),
-
βквантил розподілу chi-квадрата з
n-1градусом свободи. (Це випливає з того, що
(n-1)s2/σ2- основна величина в гауссовій обстановці.)
χ2β(n−1)βn−1(n−1)s2/σ2
Ми хочемо мінімізувати ширину, щоб
тому нам залишається вирішити для n таке, що
( n - 1 ) ( 1
L(n)=(n−1)s2χ2(α/2)(n−1)−(n−1)s2χ2(1−α/2)(n−1)<ρs2,
n(n−1)⎛⎝⎜1χ2(α/2)(n−1)−1χ2(1−α/2)(n−1)⎞⎠⎟<ρ.
У випадку 99% довірчого інтервалу отримаємо при ρ = 1 і n = 5321 при ρ = 0,1 . Цей останній випадок дає інтервал, який ( все-таки! ) На 10% більший, ніж бальна оцінка дисперсії.n=65ρ=1n=5321ρ=0.1
Якщо обраний рівень довіри менше 99%, то для нижчого значення буде отриманий той самий інтервал ширини . Але, п може по- , як і раніше може бути більше , ніж ви б здогадалися.nn
Діаграма розміру вибірки проти пропорційної ширини ρ показує щось, що виглядає асимптотично лінійним за шкалою журналу журналу; Іншими словами, відносини, подібні до влади. Ми можемо оцінити силу цього правовідносини (грубо) якnρ
α^≈log0.1−log1log5321−log65=−log10log523165≈−0.525,
що, на жаль, рішуче повільно!
Це свого роду "канонічний" випадок, щоб дати вам уявлення про те, як рухатись до розрахунку. На основі ваших сюжетів ваші дані не виглядають особливо нормально; зокрема, є те, що здається помітним косою.
Але це повинно дати вам бальне уявлення про те, що чекати. Зауважте, що для того, щоб відповісти на ваше друге вище запитання, потрібно спочатку зафіксувати деякий рівень довіри, який я встановив на рівні 99% у вищезгаданій розробці для демонстраційних цілей.