Чи можливо знайти комбіноване стандартне відхилення?


32

Припустимо, у мене є 2 набори:

Встановіть A : кількість елементів , ,мк = 2,4 σ = 0,8n=10μ=2.4σ=0.8

Встановити B : кількість елементів , ,мк = 2 σ = 1,2n=5μ=2σ=1.2

Я можу легко знайти комбіноване середнє значення ( ), але як я повинен знайти комбіноване стандартне відхилення?μ


Відповіді:


30

Отже, якщо ви просто хочете, щоб два зразки були об'єднані в один, у вас є:

s1=1n1Σi=1n1(xiy¯1)2

s2=1n2Σi=1n2(yiy¯2)2

де і - вибіркові засоби, а і - стандартні відхилення вибірки. ˉ y 2s1s2y¯1y¯2s1s2

Щоб додати їх, у вас є:

s=1n1+n2Σi=1n1+n2(ziy¯)2

що не так просто, оскільки нове середнє значення відрізняється від та :ˉ y 1 ˉ y 2y¯y¯1y¯2

y¯=1n1+n2Σi=1n1+n2zi=n1y¯1+n2y¯2n1+n2

Остаточна формула:

s=n1s12+n2s22+n1(y¯1y¯)2+n2(y¯2y¯)2n1+n2

Для поширеної версії стандартного відхилення з коригуваною Бесселем (" знаменником") результати для засобів є такими, як раніше, алеn1

s=(n11)s12+(n21)s22+n1(y¯1y¯)2+n2(y¯2y¯)2n1+n21

Більше інформації можна прочитати тут: http://en.wikipedia.org/wiki/Standard_deviation


1
Якщо ОП використовує скореговану Бесселем ( знаменник для дисперсії) версію зразкового стандартного відхилення (як це робитимуть майже всі, хто запитає тут), ця відповідь не дасть їм того, чого вони прагнуть. n1
Glen_b -Встановіть Моніку

У цьому випадку цей розділ виконує свою справу . (редагувати для посилання на стару версію вікіпедії, оскільки її видалено з нової)
Glen_b -Встановити Моніку

@Glen_b Хороший улов. Чи можете ви відредагувати це у відповідь, щоб потім було корисніше?
сашкелло

Я пішов у Вікіпедію, щоб знайти докази, але, на жаль, цієї формули вже немає. Хочете розробити (доказ) чи покращити Вікіпедію? :)
Рауні Ліллемець


8

Це, очевидно, поширюється на групи:K

s=k=1K(nk1)sk2+nk(y¯ky¯)2(k=1Knk)1

7
Це трохи стисло за стандартами. Не могли б ви сказати трохи більше про те, як це відбувається та чому це правильна відповідь?
Sycorax каже, що повернеться Моніка

1

У мене була така ж проблема: маючи стандартне відхилення, засоби та розміри декількох підмножин із порожнім перетином, обчислити стандартне відхилення об'єднання цих підмножин.

Мені подобається відповідь sashkello та Glen_b ♦ , але я хотів знайти доказ цього. Я зробив це таким чином, і залишаю його тут, якщо це комусь допоможе.


s=(n1s12+n2s22+n1(y¯1y¯)2+n2(y¯2y¯)2n1+n2)1/2

(n1s12+n2s22+n1(y¯1y¯)2+n2(y¯2y¯)2n1+n2)1/2=(i=1n1(xiy1¯)2+i=1n2(yiy2¯)2+n1(y¯1y¯)2+n2(y¯2y¯)2n1+n2)1/2=(i=1n1((xiy1¯)2+(y¯1y¯)2)+i=1n2((yiy2¯)2+(y¯2y¯)2)n1+n2)1/2=(i=1n1(xi2+y¯2+2y1¯22xiy1¯2y1¯y¯)n1+n2+i=1n2(yi2+y¯2+2y2¯22yiy2¯2y2¯y¯)n1+n2)1/2=(i=1n1(xi2+y¯22y¯j=1n1xjn1)+2n1y1¯22y1¯i=1n1xin1+n2+i=1n2(yi2+y¯22y¯j=1n2yjn2)+2n2y2¯22y2¯i=1n2yin1+n2)1/2=(i=1n1(xi2+y¯22y¯j=1n1xjn1)+2n1y1¯22y1¯n1y1¯n1+n2+i=1n2(yi2+y¯22y¯j=1n2yjn2)+2n2y2¯22y2¯n2y2¯n1+n2)1/2=(i=1n1(xi2+y¯22y¯j=1n1xjn1)n1+n2+i=1n2(yi2+y¯22y¯j=1n2yjn2)n1+n2)1/2

2y¯j=1n1xjn1
n1
i=1n1(xi2+y¯22y¯xi),

=(i=1n1(xiy¯)2n1+n2+i=1n2(yiy¯)2n1+n2)1/2=(i=1n1+n2(ziy¯)2n1+n2)1/2=s

Це було сказано, мабуть, є простіший спосіб зробити це.

k


Я не бачу, наскільки питання зрозуміле. Чи передбачається, що два набори даних походять від одного розподілу? Чи є в ОП фактичні спостереження чи просто вибіркові оцінки середнього та стандартного відхилень?
Майкл Р. Черник

Так, вони приймаються з того самого розповсюдження. Спостереження недоступні, лише середнє та стандартне відхилення підмножини.
iipr

Тоді навіщо використовувати формулу, яка передбачає окремі спостереження?
Майкл Р. Черник

Можливо, моя відповідь не зрозуміла. Я просто розміщую математичне підтвердження вищевказаної формули, що дозволяє обчислити sстандартні відхилення, засоби та розміри двох підмножин. У формулі немає посилання на окремі спостереження. У доказу є, але це просто доказ, і з моєї точки зору, правильний.
iipr
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.