Загальний метод отримання стандартної помилки


11

Я, здається, не можу ніде знайти загальний метод отримання стандартних помилок. Я переглянув google, цей веб-сайт і навіть підручники, але все, що я можу знайти, - це формула стандартних помилок для середнього значення, дисперсії, пропорції, співвідношення ризиків тощо ..., а не те, як ці формули були отримані.

Якщо будь-який орган міг би пояснити це простими словами або навіть зв’язати мене з хорошим ресурсом, який пояснює це, я буду вдячний.


2
Я надаю загальну просту модель і застосовую її, з усіма деталями розробленими, у публікації на сайті stats.stackexchange.com/a/18609/919 . Цю та багато інших публікацій про стандартні помилки (майже тисячу на сьогоднішній день) можна знайти,
пошукаючи

Відповіді:


22

Що ви хочете знайти, це стандартне відхилення розподілу вибірки середнього. Тобто, простою англійською мовою розподіл вибірки - це коли вибираєте елементів із своєї сукупності, додаєте їх разом і ділите суму на . Ми ніж знаходимо дисперсію цієї величини і отримуємо стандартне відхилення, беручи квадратний корінь його дисперсії.nnn

Отже, нехай вибрані вами елементи представляються випадковими змінними , кожна з них однаково розподілена з дисперсією . Вони незалежно відбираються, тому дисперсія суми є лише сумою дисперсій. σ 2 Var ( n i = 1 X i ) = n i = 1 Var ( X i ) = n i = 1 σ 2 = n σ 2Xi,1inσ2

Var(i=1nXi)=i=1nVar(Xi)=i=1nσ2=nσ2

Далі ділимо на . Ми загалом знаємо, що , тому ставимо насVar ( k Y ) = k 2 Var ( Y ) k = 1 / nnVar(kY)=k2Var(Y)k=1/n

Var(i=1nXin)=1n2Var(i=1nXi)=1n2nσ2=σ2n

Нарешті візьміть квадратний корінь, щоб отримати стандартне відхилення . Якщо стандартне відхилення сукупності недоступне, стандартне відхилення вибірки використовується як оцінка, даючи . ssσnssn

Все вищесказане справедливо незалежно від розподілу s, але виникає питання, що ви насправді хочете зробити зі стандартною помилкою? Зазвичай ви можете побудувати довірчі інтервали, і тоді важливо призначити ймовірність побудови довірчого інтервалу, який містить середнє значення.Xi

Якщо ваші s звичайно розподіляються, це легко, оскільки тоді розподіл вибірки також зазвичай розподіляється. Можна сказати, що 68% вибірок середнього значення буде лежати в межах 1 стандартної помилки від істинного середнього, 95% - у межах 2 стандартних помилок тощо.Xi

Якщо у вас є достатньо великий вибірки (або менший зразок і s не надто аномальні), ви можете посилатися на теорему про центральний межа і сказати, що розподіл вибірки приблизно нормально розподілений, і ваші твердження про ймовірність також приблизні.Xi

Справа в оцінці пропорції , де ви черпаєте по елементів з розподілу Bernouilli. Варіантність кожного розподілу дорівнює а отже, стандартна помилка - (пропорція оцінюється за допомогою даних). Потім переходимо до того, що приблизно якийсь відсоток зразків знаходиться в межах стільки стандартних відхилень середнього значення, вам потрібно зрозуміти, коли розподіл вибірки приблизно нормальний. Багаторазово вибірки з розподілу Бернуллі є таким же , як вибірка з розподілу біноміального, і один загальне правило полягає в тому , щоб апроксимувати тільки тоді , коли і єn X i p ( 1 - p ) pnXip(1p) pnpn(1-p)5p(1p)/npnpn(1p)5. (Див. Вікіпедію для більш поглибленої дискусії про наближення двочлена до нормальної. Дивіться тут спрацьований приклад стандартних помилок із пропорцією.)

Якщо, з іншого боку, ваш розподіл вибірки не може бути наближений нормальним розподілом, то стандартна помилка набагато менш корисна. Наприклад, при дуже перекошеному асиметричному розподілі ви не можете сказати, що той самий% вибірок буде стандартним відхиленням будь-якої сторони від середнього, і ви, можливо, захочете знайти інший спосіб асоціювання ймовірностей із зразками.±1


Дякую, такий підхід має сенс, і я бачу, як він застосовується до середнього, але я не бачу, як його поширити на інші статистичні дані. Наприклад, як я можу знайти стандартну помилку ставки? чи коефіцієнт ставки?
Даніель Гардінер

Я оновив свою публікацію. Ключовим моментом є те, що такі величини, як середнє значення, дисперсія тощо - а отже, і більш жорсткі - можна знайти для будь-якого розподілу. Але для того, щоб робити твердження про ймовірність, потрібно знати щось про розподіл, будь то нормальне, двочленове чи будь-яке інше. Так що stderr завжди можна знайти, але наскільки це корисно, залежить від ситуації.
TooTone

var(Xi)=σ2s2

1
XiXis2s2Xis2
TooTone

4

Стандартна помилка - це стандартне відхилення статистики (під нульовою гіпотезою, якщо ви тестуєте). Загальним методом пошуку стандартної помилки було б спочатку знайти функцію розподілу чи генерації моменту вашої статистики, знайти другий центральний момент та взяти квадратний корінь.

μσ2X¯=1ni=1nXiμσ2/n

  1. Сума незалежних випадкових величин є нормальною,
  2. E[i=1naiXi]=i=1naiE[Xi]
  3. X1X2Var(a1X1+a2X2)=a12Var(X1)+a22Var(X2)

σ/n

Є ярлики, начебто вам не обов’язково потрібно знаходити розподіл статистики, але я думаю, що концептуально корисно мати розподіли в задній частині розуму, якщо ви знаєте їх.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.