Яка різниця між дисперсією та стандартним відхиленням?


127

Мені було цікаво, чим відрізняється дисперсія від стандартного відхилення.

Якщо обчислити два значення, зрозуміло, що ви отримуєте стандартне відхилення від дисперсії, але що це означає з точки зору розподілу, який ви спостерігаєте?

Крім того, навіщо вам справді потрібне стандартне відхилення?



12
Ви, мабуть, відповідь вже отримали Однак це посилання має найпростіше і найкраще пояснення. mathsisfun.com/data/standard-deviation.html

2
Стандартне відхилення корисно, оскільки значення знаходиться в тій же шкалі, що і дані, з яких було обчислено. Якщо вимірювати лічильники, то стандартне відхилення становитиме метри. Варіантність, навпаки, буде метрів у квадраті.
Владислав Довгалеч

Стандартна варіація може бути неупередженою, але стандартне відхилення не може, оскільки функція «root root» нелінійна
Дакш Гаргас

Відповіді:


84

Стандартне відхилення - квадратний корінь дисперсії.

Стандартне відхилення виражається в тих же одиницях, що і середнє значення, тоді як дисперсія виражається у квадратичних одиницях, але для перегляду розподілу ви можете використовувати або лише до тих пір, поки вам зрозуміло, що ви використовуєте. Наприклад, нормальний розподіл із середнім = 10 та sd = 3 - це те саме, що нормальний розподіл із середнім = 10 та дисперсією = 9.


58
так, це математичний спосіб пояснити ці два параметри, АЛЕ що логічне пояснення? Чому я дійсно не два параметри, щоб показати одне і те ж (відхилення навколо середнього арифметичного) ...
Le Max

5
Вам обох не потрібно. Якщо ви повідомляєте про одне, вам не потрібно повідомляти про інше
Пітер Флом

8
Нам потрібно і те, і інше: стандартне відхилення добре для інтерпретації, повідомлення. Для розробки теорії варіація краще.
kjetil b halvorsen

4
Перевага звітування про стандартне відхилення полягає в тому, що він залишається в масштабі даних. Скажімо, зразок висоти дорослих знаходиться в метрах, тоді стандартне відхилення також буде в метрах.
Владислав Довгалець

5
@RushatRai При роботі з сумами випадкових величин відхилення складаються разом. Для незалежних випадкових величин . Подібний вираз існує в загальному випадку без незалежності (з корекцією за допомогою коваріаційних доданків). Взагалі, перетворення квадратного кореня ускладнює речі та ускладнює роботу з аналітичним стандартним відхиленням. Var(Xi)=Var(Xi)
кнрумсей

49

Вам не потрібно обоє. У кожного вони різні цілі. SD зазвичай корисніше описати мінливість даних, тоді як дисперсія зазвичай математично набагато корисніша. Наприклад, сума некорельованих розподілів (випадкових змінних) також має дисперсію, яка є сумою дисперсій цих розподілів. Це не було би правдою для SD. З іншого боку, SD має зручність виражатися в одиницях вихідної змінної.


24

Якщо Джон посилається на незалежні випадкові величини, коли він говорить "неспоріднені розподіли", то його відповідь правильна. Однак, щоб відповісти на ваше запитання, можна додати кілька пунктів:

  1. Середнє значення та дисперсія - два параметри, що визначають нормальний розподіл.

  2. Нерівність Чебишева обмежує ймовірність того, що спостерігається випадкова величина знаходиться в межах стандартних відхилень середнього значення.k

  3. Стандартне відхилення використовується для нормалізації статистичних даних для статистичних випробувань (наприклад, відоме стандартне відхилення використовується для нормалізації середнього зразка для тесту що середнє значення відрізняється від або стандартне відхилення вибірки використовується для нормалізації середнього значення вибірки, коли справжній стандарт відхилення невідоме, в результаті чого випробовується ).z0t

  4. Для нормального розподілу відсотків розподілу знаходиться в межах стандартного відхилення. в межах стандартних відхилень і понад в межах стандартних відхилень.68%195.4%299%3

  5. Похибка виражається як кратне стандартного відхилення оцінки.

  6. Варіантність та зміщення - це міри невизначеності у випадковій кількості. Середня квадратна помилка для оцінки дорівнює дисперсії + квадратичному зміщенню.


4
Напевно, ви не повинні говорити "природний параметр", середній поділений на дисперсію, а 1 розділений на дисперсію: en.wikipedia.org/wiki/Natural_parameter
Neil G

Згідно з посиланням на вікіпедію, природний параметр (и) для нормального розподілу з точки зору його експоненціальної форми сім'ї залежить від того, вважається чи ні відомим чи невідомим. Але я розумію, і я взяв "природні параметри" з своєї відповіді. σ
Майкл Черник

У пункті 3, чи не повинно бути "стандартне відхилення використовується для стандартизації статистики", а не нормалізувати?
Гаррі

15

Дисперсія набору даних вимірює математичну дисперсність даних відносно середньої. Однак, хоча це значення є теоретично правильним, його важко застосувати в реальному розумінні, оскільки значення, які використовуються для його обчислення, були у квадраті. Стандартне відхилення, оскільки квадратний корінь дисперсії дає значення, яке знаходиться в тих же одиницях, що і вихідні значення, що значно полегшує роботу і простіше інтерпретувати в поєднанні з поняттям нормальної кривої.


Це чудово працює, пояснюючи, чому просто.
gwg

3
Ще одним хорошим моментом, який слід зробити, було б те, щоб кожен метричний sd і var вимірював поширення змінної щодо середнього. Взяття квадратного кореня дисперсії для отримання стандартного відхилення можна розглядати як коефіцієнт масштабування, застосований для повернення метрики в одиниці змінної.
Метт Л.

6

З точки зору розподілу вони еквівалентні (але, очевидно, не взаємозамінні), але будьте уважні, що з точки зору оцінок вони не є: квадратний корінь оцінки дисперсії НЕ є (неупередженим) оцінкою стандартного відхилення. Тільки для помірно великої кількості зразків (і в залежності від оцінювачів) вони наближаються один до одного. Для невеликих розмірів вибірки потрібно знати параметричну форму розподілу для перетворення між двома, яка може стати трохи круглою.


4

Обчислюючи дисперсію, ми квадратували відхилення. Це означає, що якщо дані дані (спостереження) знаходяться в метрах, вони стануть квадратними метрами. Сподіваємось, це неправильне уявлення про відхилення. Отже, ми знову формуємо корінь (SD), що є не що інше, як SD.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.