Може означати плюс одне стандартне відхилення перевищити максимальне значення?


19

Я маю середнє значення 74,10 та стандартне відхилення 33,44 для вибірки, яка має мінімум 0 та максимум 94,33.

Професор запитує мене, як може означати, що плюс одне стандартне відхилення перевищує максимум.

Я показав їй багато прикладів з цього приводу, але вона не розуміє. Мені потрібна деяка довідка, щоб показати її. Це може бути будь-яка глава чи параграф із книги статистики, який особливо про це говорить.


Чому ви хочете додати (або відняти) одне стандартне відхилення від середнього? SD - це міра поширення даних. Чи хотіли ви, замість цього, стандартної помилки середнього?
Відновіть Моніку - Г. Сімпсон

Я не хочу додавати чи віднімати. Мені потрібен професор. Саме так вона розуміє стандартне відхилення
Боюн Омуру

5
Цікавий приклад - зразок (0,01,0,02,0,98,0,99). І середнє значення, і стандартне відхилення, і середнє мінус стандартне відхилення лежать поза [0,1].
Glen_b -Встановіть Моніку

Можливо, вона просто думає про нормальний розподіл?
користувач765195

Відповіді:


28

Безумовно, середнє значення плюс один sd може перевищити найбільше спостереження.

Розглянемо зразок 1, 5, 5, 5 -

він має середнє значення 4 і стандартне відхилення 2, тому середнє значення + sd дорівнює 6, на один більше, ніж максимум вибірки. Ось розрахунок у R:

> x=c(1,5,5,5)
> mean(x)+sd(x)
[1] 6

Це звичайне явище. Це трапляється, коли є купа високих значень і відхилений хвіст ліворуч (тобто, коли є сильна ліва косоокість і пік майже максимум).

-

Така ж можливість стосується розподілу ймовірностей, а не лише вибірок - середнє значення сукупності плюс кількість населення sd може легко перевищити максимально можливе значення.

Ось приклад щільність, яка має максимально можливе значення 1:beta(10,12)

введіть тут опис зображення

У цьому випадку ми можемо подивитися на сторінку Вікіпедії для бета-розподілу, де зазначено, що середнє значення:

E[X]=αα+β

а дисперсія:

вар[Х]=αβ(α+β)2(α+β+1)

(Хоча нам не потрібно покладатися на Вікіпедію, оскільки їх досить легко отримати.)

Отже для і β = 1α=10 маємо середнє значення0,9523і sd0,0628, тому середнє + sd1,0152, більше можливого максимуму 1.β=120,95230,06281,0152

Тобто, легко можливо мати значення середнє значення + sd, яке не можна спостерігати як значення даних .

-

У будь-якій ситуації, коли режим був на максимумі, нахил режиму Пірсона повинен бути лише для середнього + sd, що перевищує максимум. Він може приймати будь-яке значення, позитивне чи негативне, тому ми можемо бачити, що це легко можливо.<-1

-

Тісно пов'язане питання часто зустрічається з довірчими інтервалами для біноміальної пропорції , де загальновживаний інтервал, інтервал нормального наближення може створювати межі поза .[0,1]

Наприклад, розглянемо 95,4% нормальний інтервал наближення для частки успішності населення у випробуваннях Бернуллі (результати - 1 або 0, що відображає події успіху та невдачі відповідно), де 3 з 4 спостережень - " ", а одне спостереження - " 0 ".10

Потім верхню межу для інтервалу р + 2 × p^+2×14p^(1-p^)=p^+p^(1-p^)=0,75+0,433=1.183

Це просто середнє значення вибірки + звичайна оцінка sd для двочлена ... і дає неможливе значення.

Звичайний зразок С.О. для 0,1,1,1 становить 0,5 , а не 0,433 (вони розрізняються , так як Біноміальна оцінка ОД стандартного відхилення р ( 1 - р ) відповідають розподілам дисперсії по п , а не п - 1 ) . Але це не має ніякої різниці - в будь-якому випадку середнє значення + sd перевищує найбільшу можливу пропорцію.p^(1-p^)нн-1

Цей факт - про те, що нормальний інтервал наближення для бінома може давати "неможливі значення", часто відзначається в книгах і працях. Однак ви не маєте справу з біноміальними даними. Однак проблема - що середнє значення + деяка кількість стандартних відхилень не є можливим значенням - є аналогічною.

-

У вашому випадку незвичне значення "0" у вашому зразку робить sd великим більше, ніж він тягне середнє вниз, через що середнє значення + sd є високим.

введіть тут опис зображення

-

(Натомість питання буде - через які міркування це було б неможливо? - тому що, не знаючи, чому хтось подумає, що взагалі є проблема, до чого ми звертаємось?)

Логічно, звичайно, кожен демонструє, що це можливо, наводячи приклад, де це відбувається. Ви вже зробили це. За відсутності вказаної причини, чому слід інакше, що ти робиш?

Якщо прикладу недостатньо, який доказ був би прийнятним?

Насправді немає сенсу просто вказувати на твердження в книзі, оскільки будь-яка книга може зробити помилку з помилкою - я їх постійно бачу. Треба розраховувати на пряму демонстрацію того, що це можливо, або доказ алгебри (можна побудувати з бета-прикладу вище, наприклад *), або на числовому прикладі (який ви вже подали), який кожен може вивчити для себе правду .

* whuber дає точні умови для бета-версії у коментарях.


5
0<β<1α>β(1+β)/(1-β)(α,β)1

Дозвольте пояснити далі. Я шукаю відсоток точності конкретного приладу, що використовується для корекції зубів. І цей прилад виконував відсоток точності для 7 зубів, як описано нижче:% 76,19,% 77,41,% 94,33,% 91,06,% 0, 87,77,% 91,96. Мій професор додає одне стандартне відхилення до середнього та констатує, що результат не може перевищувати максимальне значення навіть на 100%, оскільки% 100 - це максимальний відсоток точності, який може виконати пристрій.
Боюн Омуру

2
Вона права, що відсоток> 100% не має сенсу у вашій ситуації. Проблема - це фактично нестабільна передумова, що додавання одного sd до середнього має мати сенс у цьому контексті, коли цього немає . Ось звідки я вважаю, що виникає ваша складність. Якби ми зрозуміли, звідки приходить приміщення, це може призвести до кращого вирішення. Цілком можливо, що простий факт десь викладений у книзі (хоча це тривіальне спостереження, можливо, це теж не можливо), але я сумніваюся, що він коли-небудь буде поставлений таким чином, що задовольнить її, тому що її хибність Привід є джерелом проблеми.
Glen_b -Встановіть Моніку

1
Дійсно - моя незначна думка полягає в тому, що ця цікавість є результатом того, що стандартні відхилення являють собою сильно несиметричні розподіли, а не результатом взяття вибірки. Але загалом, я вважаю, що ваша відповідь чудова
Генрі

2
@tomka Я намагався допомогти багатьом студентам у подібній позиції. Я врешті-решт дізнався (можливо, не дивно) правило про те, що навчити керівника нічого не можна через середовище їхнього учня.
Glen_b -Встановіть Моніку

4

За нерівності Чебишева менше k -2 балів може бути більше, ніж k стандартних відхилень. Отже, для k = 1, що означає, що менше 100% ваших зразків може бути більше одного стандартного відхилення.

Цікавіше подивитися на низьку межу. Ваш професор повинен бути більше здивований, що є бали, які приблизно на 2,5 стандартних відхилень нижче середнього. Але тепер ми знаємо, що лише приблизно 1/6 ваших зразків може бути 0.


3

σσ


5
Це приємний внесок. Я не впевнений, що SD дійсно "бере на себе" нормальний розподіл, хоча.
gung - Відновіть Моніку

3
"Пристосування розподілу" та пошук трансформації до нормальності - це різні процедури з різними цілями.
whuber

2

Х10<p<101-p

Е(Х)=p,SЕ(Х)=p(1-p)

І ми хочемо

Е(Х)+SЕ(Х)>1p+p(1-p)>1

p(1-p)>(1-p)

Отримайте квадрат з обох сторін

p(1-p)>(1-p)2p>1-pp>12

p>1/2Е(Х)+SЕ(Х)>максХ

p=0,71

U(а,б)Е(U)+SЕ(U)<максU=б

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.