Чому цей уривок говорить про те, що об'єктивна оцінка стандартного відхилення зазвичай не має значення?


14

Я читав про обчислення неупередженої оцінки стандартного відхилення та вказане джерело

(...) За винятком деяких важливих ситуацій, це завдання мало стосується застосувань статистики, оскільки її необхідність уникається стандартними процедурами, такими як тестування значущості та довірчих інтервалів, або за допомогою байєсівського аналізу.

Мені було цікаво, чи може хтось з'ясувати міркування цього твердження, наприклад, чи не довірчий інтервал використовує стандартне відхилення як частину розрахунку? Отже, чи не впливали б на інтервали довіри упереджене стандартне відхилення?

Редагувати:

Дякую за відповіді поки що, але я не зовсім впевнений, що я дотримуюся деяких міркувань для них, тому я додам дуже простий приклад. Справа в тому, що якщо джерело правильне, то щось не так, від мого висновку до прикладу, і я хотів би, щоб хтось вказав, як значення p не залежить від стандартного відхилення.

Припустимо, дослідник хотів би перевірити, чи відрізняється середній бал п’ятикласників на тесті у його місті від середнього значення 76 із рівнем значущості 0,05. Дослідник випадковим чином відбирав бали у 20 учнів. Середнє значення для вибірки становило 80,85 при стандартному відхиленні вибірки 8,87. Це означає: t = (80,85-76) / (8,87 / sqrt (20)) = 2,44. Потім використовується таблиця t для обчислення того, що двохвосте значення ймовірності на рівні 2,44 при 19 df дорівнює 0,025. Це нижче нашого рівня значущості 0,05, тому ми відкидаємо нульову гіпотезу.

Отож, у цьому прикладі, чи не змінилось би значення p (а може бути і ваш висновок) залежно від того, як ви оцінювали стандартне відхилення вибірки?


2
Це здається дивним з тієї причини, яку ви даєте. Можливо, ви могли б дати нам абзац і раніше, якщо щось не вистачає? Одне, що робить упередження не дуже важливим, це те, що він стає досить неважливим, оскільки розмір вибірки збільшується, і, ймовірно, не є істотним порівняно з усіма іншими проблемами, наприклад, неправильною специфікацією моделі, яку ми зазвичай маємо - але це не причина наведений у вашому джерелі.
Пітер Елліс

1
@PeterEllis, це насправді зі сторінки вікіпедії на тему "неупереджена оцінка стандартного відхилення" ( en.wikipedia.org/wiki/Unbiased_estimation_of_standard_deviation ).
BYS2

Відповіді:


17

Я погоджуюся з Glen_b щодо цього. Можливо, я можу додати кілька слів, щоб зробити точку яснішою. Якщо дані надходять із звичайного розподілу (наприклад, ситуація) з невідомою дисперсією, то t-статистика - це основна кількість, яка використовується для генерування довірчих інтервалів та тестування гіпотез. Єдине, що має значення для цього умовиводу, - це його розподіл за нульовою гіпотезою (для визначення критичного значення) та за альтернативою (для визначення потужності та вибірки). Це центральний і нецентральний розподіли відповідно. Тепер, розглянувши на мить одну проблему вибірки, тест t навіть має оптимальні властивості як тест на середнє значення нормального розподілу. Тепер дисперсія вибірки є неупередженою оцінкою дисперсії популяції, але її квадратний корінь є БІАСЕДним оцінкою стандартного відхилення популяції. Це не так t незалежно від того, що цей оцінювач BIASED входить у знаменник основної величини. Зараз це відіграє певну роль у тому, що вона є послідовною оцінкою. Саме це дозволяє розподілу t наближатися до стандартного нормального, оскільки розмір вибірки йде до нескінченності. Але бути упередженим до будь-якого виправленогоn не впливає на приємні властивості тесту.

На мою думку, неупередженість підкреслюється у вступних класах статистики. Точність та послідовність оцінювачів - справжні властивості, на які варто звернути увагу.

Для інших проблем, де застосовуються параметричні чи непараметричні методи, оцінка стандартного відхилення навіть не входить у формулу.


7
Це залежить від оцінки, але існує лише одна оцінка, для якої застосовується t з 19 градусами свободи, і ця оцінка є квадратним коренем звичайної оцінки дисперсії вибірки. Якщо ви використовуєте іншу оцінку стандартного відхилення, у вас є різне опорне розподіл для тестової статистики під нульовою гіпотезою. Це не т.
Майкл Р. Черник

2
@ BYS2: Зауважте, що з точки зору інтервалу, побудованого у наведеному прикладі, нічого не змінюється шляхом множення вибіркового стандартного відхилення на коефіцієнт масштабу (наприклад, щоб зробити його неупередженим). Розподіл тестової статистики буде змінюватися (трохи) в цьому випадку, але CI побудував би в кінцевому підсумку точно так же! Тепер, якщо ви зробили якусь "корекцію", яка залежала від самих даних, це призвело б до чогось іншого (загалом). Дивіться мій коментар під відповіддю Глена.
кардинал

4
@ BYS2: У звичайній моделі моделі, що використовує -statistic, є приємна відповідність між CI та p -значенням. Отже, значення p- значення не зміниться, якщо ви "перерахуйте" стандартне відхилення вибірки на відому константу. Наприклад: Нехай ~ T Ь = ( ˉ Х - μ ) / ( б сг ) = Т / б при фіксованому б > 0 . Тоді P ( ˜ T b > u ) = P (tppT~b=(X¯μ)/(bσ^)=T/bb>0 і тому критичне значення ˜ t b , α = b t α , тобто між ними існує відповідність один до одного. Чи має це сенс?
P(T~b>u)=P(T>bu)
t~b,α=btα
кардинал

1
Не те, на що Кардинал правильно вказує, це те, що можна помножити t статистику на постійну, по суті використовувати іншу оцінку стандартного відхилення. Тестова статистика більше не має розподілу t. Це дещо інший розподіл через постійність. Середнє значення змінюється на коефіцієнт b, так само як і стандартне відхилення. Коли ви збираєтеся обчислювати критичне значення для тестової статистики, воно змінюється належним чином, як він демонструє вище.
Майкл Р. Черник

1
@ BYS2 Так, це правильно.
Майкл Р. Черник

5

Розглянемо інтервал, обчислений на основі основної величини, як t-статистика. Середнє значення оцінювача для стандартного відхилення насправді не надходить до нього - інтервал заснований на розподілі статистики. Тож твердження правильне, наскільки це стосується.


1
Так, але чи розподіл статистики не покладається на його стандартне відхилення, яке невідоме в більшості випадків, тому вам потрібно використовувати оцінювач?
BYS2

4
(+1) Глен. До @ BYS2: Тут є кілька ключових моментів. По-перше, якщо у нас є основна кількість, це дуже зручний спосіб побудови наборів довіри, але вони часто не існують. Вся суть основної величини полягає в тому, що розподіл залежить виключно від відомих величин. По-друге, основна кількість тісно пов'язана з базовою моделлю. Якщо дані відхиляються від прийнятої моделі, то також може бути розподіл тестової статистики та її характеристика як основна кількість може бути не настільки актуальною. :)
кардинал

4

Інтерпретація - це завжди спекуляція, але я думаю, що сенс має на увазі, що часто можна отримати бажаний результат, не чітко оцінюючи стандартне відхилення. Іншими словами, я думаю, що автор має на увазі ситуації, коли ви б не використовували оцінку стандартного відхилення, а не упереджену оцінку.

Наприклад, якщо ви можете побудувати оцінку всього розподілу статистики, ви можете обчислити довірчі інтервали без використання стандартного відхилення. Насправді, для багатьох (не нормальних) розподілів самого стандартного відхилення (і середнього) недостатньо для обчислення оцінки довірчого інтервалу. В інших випадках, наприклад тестовому знаку , оцінку для стандартного відхилення також не потрібно.

(Звичайно, побудувати неупереджену оцінку повного розподілу нетривіально , і в баєсівській статистиці насправді досить часто вводити упередження прямо через попереднє.)


1
Можливо, буде цікаво трохи детальніше розглянути те, що ви мали на увазі під останнім абзацом. Наприклад, якщо я можу взяти вибірку з розподілу статистики, що знаходиться в руці, то емпіричний cdf забезпечує дуже простий, простий засіб для генерування точкової неупередженої оцінки функції розподілу. :)
кардинал

1
maxiXimaxiXiXi

1
XiimaxiXi

2
Це правда і близька до тієї точки, яку я намагався окреслити. Перше речення останнього абзацу стосується побудови неупередженої оцінки нелінійного статистичного функціоналу, наприклад, з одного випадкового вибірки. Це сильно відрізняється від побудови неупередженої оцінки повного розподілу з випадкової вибірки самої функції. :-)
кардинал
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.