Чому за формулою стандартного відхилення береться квадратний корінь для підрахунку вибірки “N”?


9

Я намагаюся зрозуміти дуже базове поняття стандартного відхилення.

З формулиσ=i=1n(xiμ)2N

Я не можу зрозуміти, чому ми повинні вдвічі зменшити кількість населення "N", тобто чому ми хочемо взяти коли ми цього не зробили ? Хіба це не перекосує населення, яке ми розглядаємо?NN2

Не повинно бути формулою бутиσ=i=1n(xiμ)2N

Відповіді:


10

Ви намагаєтеся знайти «типове» відхилення від середнього.

Дисперсія - «середня квадратна відстань від середньої величини».

Стандартне відхилення - квадратний корінь цього.

Це робить його відхиленням середньоквадратичного відхилення від середнього.

  1. Чому б ми використовували середнє квадратичне відхилення? Що робить дисперсію цікавою? Крім усього іншого, через основний факт про дисперсії - що дисперсія суми некорельованих змінних є сумою окремих дисперсій. (Це висвітлено в ряді питань, наприклад, тут, на CrossValided. Ця зручна функція не поділяється, наприклад, середнім абсолютним відхиленням.
  2. Навіщо брати квадратний корінь цього? Тому що тоді це в тих же одиницях, що і спочатку спостереження. Він вимірює особливий тип «типової відстані» від середнього (як уже згадувалося, відстань RMS), але через вищезазначену властивість дисперсії - той, який має деякі приємні риси.

7

Стандартне відхилення являє собою квадратний корінь з дисперсії .

Дисперсія - середня квадратна відстань даних від середнього. Оскільки середнє значення - це сума, поділена на кількість підсумованих предметів, формула дисперсії:

Var(X)=E[(Xμ)2]=i=1N(xiμ)2N
Оскільки, знову ж таки, стандартне відхилення є просто квадратним коренем цього, формула для стандартного відхилення:
S.D.(X)=Var(X)=i=1N(xiμ)2N
Нічого не було додано або змінено про допущених або дисперсії тут, ми просто взяли квадратний корінь з дисперсії, тому що це те , що стандартне відхилення це .

можливо, слід зазначити, що ця формула дисперсії справедлива лише для дискретних уніформ. інакше це може сплутати відмінність між дисперсією вибірки та популяцією
Тейлор,

@Taylor, я не знаю, що ти маєш на увазі. Формула дисперсії не пов'язана з розподілом.
gung - Відновіть Моніку

формула для (вибіркової) дисперсії не пов'язана з розподілом ( en.wikipedia.org/wiki/Expected_value#Definition )
Тейлор

@Taylor, я досі не знаю, що ти маєш на увазі. Формула дисперсії не пов'язана з розподілом. Цитуючи зі сторінки Вікіпедії, "Варіант випадкової величини, X - очікуване значення відхилення у квадраті від середнього значення X ...Var(X)=E[(Xμ)2]. Це визначення включає в себе випадкові величини, які генеруються з допомогою процесів , які є дискретними, безперервними, ні, або змішаними «Формула не тільки тримати для дискретної форми ..
Гунґ - Моніка відновила

Так, саме так, якщо взяти μ=EX, але E[(Xμ)2] не обов'язково дорівнює для будь-якої випадкової величини X, 1Ni(xiμ)2. Для одного перший - константа, а другий - випадковий. Насправді незрозуміло, чи буде сума перевищує підтримкуXабо кількість зразків. Якщо останнє, дивно, що ви знаєтемк, що на практиці рідко. Якщо колишній, то так, це справедливо лише для дискретних (бо це сума) уніформ (бо ваги всі однакові).
Тейлор

1

Перше, що потрібно зрозуміти, це те, що стандартне відхилення (std) відрізняється від середнього абсолютного відхилення . Ці два визначають різні математичні властивості щодо даних.

На відміну від середнього абсолютного відхилення, стандартне відхилення (std) важить більше до значень, далеких від середніх значень, що робиться шляхом квадратування різницевих значень.

Наприклад, для наступних чотирьох точок даних:

Dата(х)|х-меан|(х-меан)2224-224-66366636х=0(|х-меан|)=16(х-меан)2=80

середнє абсолютне відхилення (aad) =16/4=4.0, і

Стандартне відхилення (std) = 80/4=20=4.47

У даних є дві точки, що знаходяться на відстані 6 від середньої величини, і дві точки, що знаходяться на відстані 2 від середнього. Отже, відхилення 4,47 має більше сенсу, ніж 4.

Оскільки тотальне спостереження завжди N, для обчислення std ми не дайвінг N, натомість ділимо загальну дисперсію на N, і візьміть його квадратний корінь, щоб привести його до тієї ж одиниці, що і вихідні дані.


0

@Mahesh Subramaniya - Це просто математичний поворот . Коли ми маємо оригінальне значення, якa/b=()d. Ми можемо отримати те саме значення, використовуючи ці два рівнянняa2b=c і cb=d.

Наприклад, просто зробіть це 52 = 2.5. Але ми хочемо лише значення не мінус.

Тепер, 522=12.5. І,12.52=2.5

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.