Стандартна помилка для середнього зразка біноміальних випадкових величин


44

Припустимо, я провожу експеримент, який може мати 2 результати, і я припускаю, що основним "справжнім" розподілом двох результатів є біноміальний розподіл з параметрами n і p : Binomial(n,p) .

Я можу обчислити стандартну помилку, SEX=σXn , від форми дисперсії Binomial(n,p):

σX2=npq
деq=1p. Отже,σX=npq . Для стандартної помилки я отримую:SEX=pq , але я десь бачив, щоSEX=pqn . Що я зробив не так?

Ця стаття дуже корисна для розуміння стандартної помилки середнього впливового
пункту.com/ Тренінг/…

З мого googling, виходить, що тісно пов'язаний предмет отримання довірчих інтервалів для біноміального розподілу є досить нюансованим і складним. Зокрема, схоже, що інтервали довіри, отримані за цією формулою, які були б "Wald Intervals" (див. En.wikipedia.org/wiki/Binomial_proportion_confidence_interval ), ведуть себе досить погано і слід уникати цього. Для отримання додаткової інформації див. Jstor.org/stable/2676784?seq=1#metadata_info_tab_contents .
aquirdturtle

Відповіді:


58

Схоже, ви використовуєте двічі двома різними способами - і як розмір вибірки, і як кількість випробувань Бернуллі, які містять біноміальну випадкову змінну; щоб усунути будь-яку неоднозначність, я буду використовувати k для позначення останнього.nk

Якщо у вас є незалежних вибірок з розподілу B i n o m i a l ( k , p ) , дисперсія середнього зразка їх вибірки дорівнюєnBinomial(k,p)

var(1ni=1nXi)=1n2i=1nvar(Xi)=nvar(Xi)n2=var(Xi)n=kpqn

де і ¯ X - те саме середнє. Це випливає з тих пірq=1pX¯

(1) ,var(cX)=c2var(X) для будь-якої випадкової величини, та будь-якої постійної c .Xc

(2) дисперсія суми незалежних випадкових величин дорівнює сумі дисперсій .

Стандартною помилкою є квадратний корінь дисперсії: X¯ . Томуkpqn

  • Коли , ви отримаєте формулу, яку ви вказали: k=npq

  • k=1pqn


3
Xvar(X)=pqXnpvar(X)=npq

2
Дякую! Ти підняв мою розгубленість. Вибачте, що це було так елементарно, я все ще вчусь :-)
Френк

6
222

1
@MichaelChernick, я уточнив згадані вами деталі. Виходячи з опису проблеми, я зрозумів, що Френк знав ці факти, але ти маєш рацію, що майбутнім читачам було б більш навчально включати деталі.
Макрос

2
Соль Лаго - У цьому випадку k = 1. Якщо ви перевернули монету 50 разів і обчислили кількість успіхів, а потім повторили експеримент 50 разів, то k = n = 50.
Переворот

9

Заплутати два біноміальних розподіли легко:

  • розподіл кількості успіхів
  • розподіл частки успіхів

npq - кількість успіхів, тоді як npq / n = pq - відношення успішностей. Це призводить до різних стандартних формул помилок.


6

Ми можемо подивитися на це таким чином:

nYY=i=1nXiXi

XiY

YY

pqpq=1p

YV(Y)=V(Xi)=V(Xi)V(Xi)=pqnV(Y)=V(Xi)=npqYnpq

p^=Ynn

V(Yn)=(1n2)V(Y)=(1n2)(npq)=pq/n

p^pq/n


$x$x

V(Xi)=V(Xi)

Існує помилка в останньому відрахуванні, V (Y / n) = (1 / n ^ 2) * V (Y) = (1 / n ^ 2) * npq = pq / n має бути правильним відрахуванням.
Тарашанкар

Вибачте, я це представив, роблячи набір тексту. Сподіваємось, відсортовано зараз.
Срібна рибка

1
Xi

2

Я думаю, що також є певна плутанина в початковому посту між стандартною помилкою і стандартним відхиленням. Стандартне відхилення - sqrt дисперсії розподілу; стандартна похибка - це стандартне відхилення оціночного середнього зразка від цього розподілу, тобто поширення засобів, які ви б спостерігали, якби ви зробили цей зразок нескінченно багато разів. Перший - це властива властивість розподілу; останнє - це показник якості вашої оцінки властивості (середнього) розподілу. Коли ви проводите експеримент з N випробувань Бернуї, щоб оцінити невідому ймовірність успіху, невизначеність вашої розрахункової p = k / N після побачення k успіхів є стандартною помилкою розрахункової пропорції, sqrt (pq / N), де q = 1 -п. Справжній розподіл характеризується параметром Р, справжньою ймовірністю успіху.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.