Що таке стандартне відхилення?


31

Що таке стандартне відхилення, як воно обчислюється та яке його використання в статистиці?


7
Я не думаю, що метою цього сайту є відповісти на запитання шестикласників. І моя дитина, зіткнувшись з таким питанням, шукає відповіді в Google. Якщо є певна частина визначення, яке ви не розумієте, запитайте. Але таке нецільове запитання на таку основну тему вказує (на мене все одно), що плакат навіть не намагався знайти відповідь. Що буде далі "Що таке число і як вони використовуються?"
PeterR

9
Я думаю, це питання нормально. Насправді, це був найбільш популярний приклад на тему питання на Площі 51. Основи тут нормальні!
Пітер Сміт

6
Погоджено, це дійсне питання. Це також добре зазначено, оскільки він запитує, наприклад, використання та розрахунок. Безумовно, метою сайту є створення сховища для ВСІХ статистичних питань.
Джоель

5
Я погоджуюся з Джоелем. Стандартне відхилення - важливе поняття в статистиці. Хіба це не було б абсурдом, якби ви не могли задати про це питання на сайті про запитання статистичних питань.
Парбері

4
Як вчитель середньої школи в колишньому житті, я скажу, що дурних питань немає. Щойно ви позначаєте питання як недостойне, у той момент ви забираєте найпотужніший спосіб навчання, тобто задаєте питання! (Я збираюся відповісти на це питання нижче.)
Adhesh Josh

Відповіді:


30

Стандартне відхилення - це число, яке представляє "розповсюдження" або "дисперсія" набору даних. Існують і інші заходи щодо розповсюдження, такі як ареал і зміна.

Ось деякі приклади наборів даних та їх стандартні відхилення:

[1,1,1]     standard deviation = 0   (there's no spread)  
[-1,1,3]    standard deviation = 1.6 (some spread) 
[-99,1,101] standard deviation = 82  (big spead)

Наведені вище набори даних мають однакове середнє значення.

Відхилення означає "відстань від середнього".

"Стандарт" тут означає "стандартизований", тобто середнє відхилення і середнє значення знаходяться в одних і тих же одиницях, на відміну від дисперсії.

Наприклад, якщо середня висота становить 2 метри , стандартне відхилення може становити 0,3 метра , тоді як дисперсія буде 0,09 метра у квадраті .

Зручно знати, що принаймні 75% точок даних завжди лежать в межах 2 стандартних відхилень від середнього значення (або близько 95%, якщо розподіл є нормальним).

Наприклад, якщо середнє значення - 100, а стандартне відхилення - 15, то принаймні 75% значень становлять від 70 до 130.

Якщо розподіл буває нормальним, то 95% значень становлять від 70 до 130.

Взагалі, показники тесту на IQ зазвичай розподіляються і мають середнє значення 100. У когось "дуже яскравий" два стандартних відхилення вище середнього, тобто показник IQ тесту 130.


Ніл, дякую за вашу відповідь, чи не могли б ви пояснити детальніше частину "стандарт" у терміні "стандартне відхилення". Якщо це доречно, ви можете, будь ласка, торкнутися того самого "стандарту" у терміні "стандартна помилка середнього". Спасибі заздалегідь.
квартира

Перегляньте свої останні зміни: у якому сенсі SD "стандартизований"? Зазвичай вона стає основою для стандартизації, але сама по собі не є стандартизованою (наприклад, її масштабування за деякою оцінкою варіації вибірки).
whuber

Це стандартизовано бути в тому ж самому агрегаті, що і середнє значення
Ніл МакГуйган

Приклад із середньою висотою 2 метри - хороший приклад необхідності подбати про використання десятків. Цей же приклад можна зробити в сантиметрах, де стандартне відхилення в 30 сантиметрів логічно випливає з дисперсії в 900 сантиметрів.
Роберт Джонс

Моє враження, що їх слід уникати в первинних одиницях вимірювання. Розглянемо результати скажімо, що ПД 0,133 в метрах, перетворених на дециметри, сантиметри і міліметри. Хтось хотів би з’ясувати, будь ласка?
Роберт Джонс

9

Цитата з Вікіпедії .

Він показує, яка кількість варіацій є від "середнього" (середнього або очікуваного / бюджетного значення). Низьке стандартне відхилення вказує на те, що точки даних, як правило, дуже близькі до середнього, тоді як високе стандартне відхилення вказує на те, що дані розкидані за великим діапазоном значень.


5

Описуючи змінну, ми, як правило, підсумовуємо її за допомогою двох заходів: міри центру та міри поширення. Загальні заходи центру включають середню, медіану та режим. Загальна міра поширення включає дисперсію та міжквартильний діапазон.

Дисперсія (представлена ​​грецькою малою сигмою, піднятою до потужності два) зазвичай використовується, коли повідомляється про середнє значення. Дисперсія - середнє квадратичне відхилення змінної. Відхилення обчислюють шляхом віднімання середнього значення з кожного спостереження. Це в квадраті, тому що в іншому випадку сума дорівнюватиме нулю, а квадратик усуває цю проблему, зберігаючи відносний розмір відхилень. Проблема використання варіації як міри розкиду полягає в тому, що вона знаходиться в одиницях квадрата. Наприклад, якщо наша змінна інтерес була висота, виміряна в дюймах, то про дисперсію повідомлялося б у квадратних дюймах, що мало сенсу. Стандартне відхилення (представлене грецькою малою сигмою) є квадратним коренем дисперсії і повертає міру поширення до вихідних одиниць.

Використовуючи стандартне відхилення, треба бути обережним до людей, які не мають сили, оскільки вони будуть перекошувати стандартне відхилення (і середнє значення), оскільки вони не є стійкими мірами поширення. Простий приклад проілюструє цю властивість. Середній показник моїх страхітливих крикетів - 13, 14, 16, 23, 26, 28, 33, 39 і 61 - це 28,11. Якщо ми вважаємо, що 61 є стороннім, і видалили його, середнє значення було б 24.


1
Грехем, мені цікаво, чи є якісь помилки у вашій відповіді. Варіантність представлена ​​грецькою малою сигмою, піднятою до сили 2 (тобто ), а стандартне відхилення - квадратний корінь цього, або просто сигма без показника (тобто ). Ви можете відредагувати свою відповідь. σσ2σ
gung - Відновіть Моніку

2

Ось як я відповів би на це запитання за допомогою діаграми.

Скажімо, ми зважуємо 30 котів і обчислюємо середню вагу. Тоді ми виробляємо графік розкидання з вагою на осі y та ідентичністю кішки на осі х. Середню вагу можна намалювати у вигляді горизонтальної лінії. Потім ми можемо малювати вертикальні лінії, які з'єднують кожну точку даних із середньою лінією - це відхилення кожної точки даних від середньої, і ми називаємо їх залишками. Тепер ці залишки можуть бути корисними, оскільки вони можуть сказати нам щось про поширення даних: якщо є багато великих залишків, то кішки сильно відрізняються за масою. І навпаки, якщо залишки в основному невеликі, то коти досить тісно скупчені навколо середньої ваги. Тож якби ми могли мати якийсь показник, який підказує нам середнє значеннядовжина залишків у цьому наборі даних, це було б зручним способом позначення того, яке поширення є в даних. Стандартне відхилення - це, фактично, довжина середнього залишку.

Я б продовжував це робити, даючи обчислення для sd, пояснюючи, чому ми квадратний, а потім квадратний корінь (мені подобається коротке і солодке пояснення Вайбхава). Тоді я б зазначив про проблеми людей, що вижили, як це робить Грех в своєму останньому абзаці.


1

Якщо потрібна інформація - це розподіл даних про середнє значення, стандартне відхилення стане в нагоді.

Сума різниці кожного значення від середнього дорівнює нулю (очевидно, оскільки значення рівномірно розподілені навколо середнього), отже, ми розбиваємо кожну різницю, щоб перетворити негативні значення в позитивні, підсумувати їх у сукупності та взяти їх квадратний корінь. Потім це значення ділиться на кількість зразків (або, чисельність сукупності). Це дає стандартне відхилення.


". Отже, ми квадратизуємо кожну різницю ...." Ми могли б взяти абсолютне значення, щоб позбутися і негативних значень. То чому ж квадратик є кращим методом, оскільки ми повинні взяти квадратний корінь наприкінці? Чому б просто не підсумовувати абсолютні значення відхилень?
Діліп Сарват

Видно це? посилання
Vaibhav Garg

Так, я вже бачив це посилання раніше. Ти мав? Я повністю розумію причини, чому застосовуються квадрати, з тих пір, як я дізнався їх понад років тому. Я розпитував ваше авторитетне використання слова , отже , у вашій фразі без будь - яких ознак того, що ви знали обгрунтування , чому сума квадратів використовуються замість суми абсолютних значень. 45
Діліп Сарват

1
@DilipSarwate, з усією повагою, Доказ авторитетом мене не вражає. Припущення про те, що "отже" є "авторитетним" - це "солом'яна людина", яку я б краще проігнорував. Рівень деталізації у будь-якому даному висловлюванні співмірний з нахилом та / або педагогічним значенням того самого в заданому контексті. Я припускаю, що людина, яка запитує "Що таке стандартне відхилення, як це .... так далі?" може не хотіти обтяжуватись суворими математичними визначеннями того самого. Спрощення є навмисним і, дозвольте запевнити, не є результатом того, що не знаю.
Вайбхав Гарг

1
І що, моліться, скажімо, "отже, ми квадрати ...", окрім доказів авторитету, які вас не вражають? Немає жодної логічної причини, чому квадратичне автоматичне рішення проблеми, як випливає з вашого "отже".
Діліп Сарват

1

Мені подобається думати про це так: стандартне відхилення - це середня відстань від середнього . Це концептуально корисніше, ніж математично корисне, але це приємний спосіб пояснити це непосвяченим.


0

Стандартне відхилення - це квадратний корінь другого центрального моменту розподілу. Центральним моментом є очікувана різниця від очікуваної величини розподілу. Перший центральний момент зазвичай дорівнює 0, тому другий центральний момент ми визначаємо як очікуване значення квадратної відстані випадкової величини від її очікуваного значення.

Щоб поставити його на шкалу, що більше відповідає оригінальним спостереженням, ми беремо квадратний корінь того другого центрального моменту і називаємо його стандартним відхиленням.

Стандартне відхилення - це властивість населення. Він вимірює, яка середня «дисперсія» є для цього населення. Чи всі обмазки скупчені навколо середини, або вони широко розкинуті?

Для оцінки стандартного відхилення популяції ми часто обчислюємо стандартне відхилення "вибірки" від цієї сукупності. Для цього ви берете спостереження з цієї сукупності, обчислюєте середнє значення цих спостережень, а потім обчислюєте квадратний корінь середнього квадратичного відхилення від цього "середнього зразка".

Щоб отримати неупереджений оцінювач дисперсії, ви насправді не обчислюєте середнє квадратичне відхилення від середнього зразка, а натомість ділите на (N-1), де N - кількість спостережень у вашій вибірці. Зауважимо, що це "вибіркове стандартне відхилення" не є неупередженим оцінкою стандартного відхилення, але квадрат "стандартного відхилення вибірки" є неупередженим оцінником дисперсії сукупності.


6
це неймовірно незрозуміла відповідь. Спробуйте написати англійською.
Ніл МакГуйган

1
можливо так. це людина, яка задає це питання людині, яка пішла з вулиці, або особа, яка хоча б відкрила книгу статистики. Розповідати комусь про стандартне відхилення - це просто квадратний корінь дисперсії, цілком викликає питання.
Балтимарк

-1

Найкращий спосіб я зрозумів стандартне відхилення - це думати про перукар! (Вам потрібно зібрати дані від перукаря і запобігти швидкості стрижки волосся, щоб цей приклад працював.)

В середньому 30 хвилин на перукарні волосся потрібно стригти волосся.

Припустимо, ви зробите розрахунок (більшість програмних пакетів зробить це за вас), і ви виявите, що стандартне відхилення становить 5 хвилин. Це означає:

  • перукар стриже волосся 68% своїх клієнтів протягом 25 хвилин і 35 хвилин
  • перукар стриже волосся 96% своїх клієнтів протягом 20 та 40 хвилин

Звідки я це знаю? Потрібно подивитися на нормальну криву, де 68% падає в межах 1 стандартного відхилення і 96% падає в межах 2 стандартних відхилень середнього значення (в цьому випадку 30 хвилин). Отже, ви додаєте або віднімаєте стандартне відхилення від середнього.

Якщо бажана консистенція, як у цьому випадку, то чим менше стандартне відхилення, тим краще. У цьому випадку перукар проводить максимум близько 40 хвилин з будь-яким клієнтом. Вам потрібно швидко стригти волосся, щоб запустити успішний салон!


Я не думаю, що ти зачитав свою відповідь, Адже. У вас тут є якась суперечлива інформація. Подивіться, чи згодні ви з моїми правками, гаразд?
rolando2

1
Ви описали лише інтерпретацію стандартного відхилення у випадку нормального розподілу. Правило "68%" та (і правило 95%) застосовуються лише для нормально розподілених даних. Принаймні констатуйте, що дві точки кулі вірні лише в тому випадку, якщо час стрижки дотримується нормального розподілу.
Макрос

Макрос, я згадав про звичайну криву, і це дано, що якщо ви використовуєте звичайну криву, дані будуть слідувати нормальному розподілу.
Адхеш Джош

@ rolando2 Я, здається, не розумію, що не так у поясненні
Адеша

@Amarald - Ви натиснули "31 січня о 1:06", щоб побачити версії до та після редагування? Я думаю, що відповідь після цього сильніша, хоча макрос також робить важливий момент.
rolando2
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.