Що ви хочете знайти, це стандартне відхилення розподілу вибірки середнього. Тобто, простою англійською мовою розподіл вибірки - це коли вибираєте елементів із своєї сукупності, додаєте їх разом і ділите суму на . Ми ніж знаходимо дисперсію цієї величини і отримуємо стандартне відхилення, беручи квадратний корінь його дисперсії.nнн
Отже, нехай вибрані вами елементи представляються випадковими змінними , кожна з них однаково розподілена з дисперсією . Вони незалежно відбираються, тому дисперсія суми є лише сумою дисперсій.
σ 2 Var ( n ∑ i = 1 X i ) = n ∑ i = 1 Var ( X i ) = n ∑ i = 1 σ 2 = n σ 2Хi, 1 ≤ i ≤ nσ2
Вар ( ∑i = 1нХi) = ∑i = 1нВар ( Xi) = ∑i = 1нσ2= n σ2
Далі ділимо на . Ми загалом знаємо, що , тому ставимо насVar ( k Y ) = k 2 Var ( Y ) k = 1 / nнВар ( k Y) = k2Вар ( Y)k = 1 / n
Вар ( ∑нi = 1Хiн) = 1н2Вар ( ∑i = 1нХi) = 1н2n σ2= σ2н
Нарешті візьміть квадратний корінь, щоб отримати стандартне відхилення . Якщо стандартне відхилення сукупності недоступне, стандартне відхилення вибірки використовується як оцінка, даючи . ssσн--√ссн--√
Все вищесказане справедливо незалежно від розподілу s, але виникає питання, що ви насправді хочете зробити зі стандартною помилкою? Зазвичай ви можете побудувати довірчі інтервали, і тоді важливо призначити ймовірність побудови довірчого інтервалу, який містить середнє значення.Хi
Якщо ваші s звичайно розподіляються, це легко, оскільки тоді розподіл вибірки також зазвичай розподіляється. Можна сказати, що 68% вибірок середнього значення буде лежати в межах 1 стандартної помилки від істинного середнього, 95% - у межах 2 стандартних помилок тощо.Хi
Якщо у вас є достатньо великий вибірки (або менший зразок і s не надто аномальні), ви можете посилатися на теорему про центральний межа і сказати, що розподіл вибірки приблизно нормально розподілений, і ваші твердження про ймовірність також приблизні.Хi
Справа в оцінці пропорції , де ви черпаєте по елементів з розподілу Bernouilli. Варіантність кожного розподілу дорівнює а отже, стандартна помилка - (пропорція оцінюється за допомогою даних). Потім переходимо до того, що приблизно якийсь відсоток зразків знаходиться в межах стільки стандартних відхилень середнього значення, вам потрібно зрозуміти, коли розподіл вибірки приблизно нормальний. Багаторазово вибірки з розподілу Бернуллі є таким же , як вибірка з розподілу біноміального, і один загальне правило полягає в тому , щоб апроксимувати тільки тоді , коли і єn X i p ( 1 - p ) √pнХip ( 1 - p ) pnpn(1-p)≥5p ( 1 - p ) / n---------√pп рn ( 1 - p )≥ 5. (Див. Вікіпедію для більш поглибленої дискусії про наближення двочлена до нормальної. Дивіться тут спрацьований приклад стандартних помилок із пропорцією.)
Якщо, з іншого боку, ваш розподіл вибірки не може бути наближений нормальним розподілом, то стандартна помилка набагато менш корисна. Наприклад, при дуже перекошеному асиметричному розподілі ви не можете сказати, що той самий% вибірок буде стандартним відхиленням будь-якої сторони від середнього, і ви, можливо, захочете знайти інший спосіб асоціювання ймовірностей із зразками.± 1