Що говорить нам стандартне відхилення при ненормальному розподілі


40

У нормальному розподілі правило 68-95-99.7 надає стандартному відхиленню багато значення, але що означатиме стандартне відхилення при ненормальному розподілі (мультимодальному або перекошеному)? Чи все-таки всі дані даних підпадають під 3 стандартні відхилення? Чи є у нас такі правила, як 68-95-99,7 для ненормативних розподілів?


16

@COOLSerdash чудово. Це чудово відповідає на моє запитання.
Зухайб Алі

3
@ Точка COOLSerdash тут націлена на ціль, але майте на увазі, що стандартне твердження про нерівність Чебишева стосується справжнього априорного SD, а не SD, оціненого з вашої вибірки. Це може допомогти прочитати цю чудову резюме CV: Чи існує зразковий варіант однобічної Чебешевської нерівності?
gung - Відновіть Моніку

Крім того, ви, мабуть, не повинні відразу влаштовуватися на Чебишева - ви, напевно, можете зробити набагато краще, перекошений чи ні.
Steve S

1
@gung так і правило 68-95-99.7!
Glen_b

Відповіді:


12

Стандартне відхилення - це одна конкретна міра зміни. Є кілька інших, середня абсолютна відхилення досить популярна. Стандартне відхилення аж ніяк не особливе. Що робить його особливим те, що розподіл Гаусса є особливим.

Як зазначається в коментарях, нерівність Чебишева корисна для отримання почуття. Однак є більше .


9

Це квадратний корінь другого центрального моменту , дисперсія. Моменти пов'язані з характерними функціями (CF), які називаються характерними з тієї причини, що вони визначають розподіл ймовірності. Отже, якщо ви знаєте всі моменти, ви знаєте CF, значить, ви знаєте весь розподіл ймовірностей.

Характерну функцію нормального розподілу визначають лише два моменти: середній і дисперсія (або стандартне відхилення). Тому для нормального розподілу особливо важливим є стандартне відхилення, яке певним чином становить 50% від його визначення.

Для інших розподілів стандартне відхилення дещо менш важливе, оскільки вони мають інші моменти. Однак для багатьох розповсюджених на практиці розповсюджень перші кілька моментів є найбільшими, тому вони є найважливішими.

Тепер, інтуїтивно, середнє підказує, де знаходиться центр вашого розповсюдження, тоді як стандартне відхилення повідомляє, наскільки близько до цього центру ваші дані.

Оскільки стандартне відхилення є в одиницях змінної, воно також використовується для масштабування інших моментів для отримання таких заходів, як куртоз . Куртоз - це безрозмірний показник, який говорить вам про те, наскільки жирними є хвости вашого розподілу порівняно з нормальними


1
"Тепер, інтуїтивно, середнє підказує, де знаходиться центр вашого розповсюдження, тоді як стандартне відхилення повідомляє про те, наскільки близькі до цього центру ваші дані". - Чи не застосовуватиметься це лише в тому випадку, якщо розподіл є нормальним? Інакше, частіше за все, медіана є кращим показником центральної тенденції.
Дан Темкін

@DanTemkin При використанні медіани стандартне відхилення втрачає значення до градуса. Це обчислюється середня сума. З медіаною тоді має сенс говорити про кванти, які могли б бути способом перейти з перекошеними розподілами. ОП не зосередилась на перекошеному розподілі. Отже, для будь-якого симетричного розподілу у вас середнє значення = медіана, воно не має верхнього рівня. Таким чином, має сенс говорити про середнє значення, коли обговорюється стандартне відхилення.
Аксакал

4

Стандартне відхилення вибірки - це міра відхилення спостережуваних значень від середнього значення в одних і тих же одиницях для вимірювання даних. Нормальний розподіл, чи ні.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.