Чому тестування основних гіпотез фокусується на середньому, а не на медіані?


32

На базових курсах зі статистики нижчих класів студентів (як правило?) Навчають тестуванню гіпотез для середньої сукупності.
Чому саме фокус робиться на середньому, а не на медіані? Я здогадуюсь, що простіше випробувати середнє через теорему про центральну межу, але я хотів би прочитати кілька освічених пояснень.


3
Середній має корисні властивості для унікальності, розрахунку та обчислення. Це часто пов'язане з достатньою статистикою.
Генрі

Відповіді:


40

Тому що Алан Тьюрінг народився після Рональда Фішера.

За старих часів, перед комп'ютерами, все це потрібно було робити вручну або, в кращому випадку, з того, що ми зараз би називали калькуляторами. Тести для порівняння засобів можна зробити таким чином - це трудомістко, але можливо. Тести на квантили (такі як медіана) було б майже неможливо зробити таким чином.

Наприклад, квантильна регресія покладається на мінімізацію відносно складної функції. Це неможливо зробити вручну. Це можливо з програмуванням. Дивіться, наприклад, Koenker або Wikipedia .

Квантильна регресія має менше припущень, ніж регресія OLS, і надає більше інформації.


6
У той час комп'ютери існували, але означали щось дуже відмінне від того, що ми маємо на увазі зараз.
Маартен Буїс

6
Справді! Комп'ютери - це люди, які робили розрахунки.
Пітер Флом - Відновити Моніку

2
@nafrtiti Навчальний план змінюється, але повільно. Подолати багато імпульсу, і люди поза статистикою не звикли до нових ідей, тому можуть їх відкинути.
Пітер Флом - Відновити Моніку

3
@SunQingyao Сортування набагато дорожче, ніж додавання. Додавання - це O (n), і це одна з найпростіших операцій обладнання та вимагає лише одного реєстру. Крім цього, все, що мені потрібно знати, - це загальна кількість та кількість елементів, щоб отримати більше даних та обчислити нове значення. Для того, щоб обчислити медіану, мені знадобиться весь набір
JimmyJames

3
За допомогою швидкого вибору (та використання медіани-5 для вибору півота, якщо випадкові штрихи вибрані випадковим чином), ви можете знайти квантил в O (N), зробивши розрив між медіаною та середнім значенням меншим. Звичайно, потрібно знати, що такі методи існують (що було невідомо ще за часів Турінга).
Surt

22

Я хотів би додати третю причину до правильних причин, викладених Гарреллом і Фломом. Причина полягає в тому, що ми використовуємо евклідову відстань (або L2), а не відстань Манхеттена (або L1) як наш стандартний показник близькості чи помилки. Якщо у вас є декілька точок даних і потрібно одне число щоб оцінити його, очевидним поняттям є пошук числа, яке мінімізує "помилку", що число створює найменшу різницю між обраним числом і числа, що складають дані. У математичних позначеннях для заданої функції помилки E потрібно знайти . Якщо взяти для E (x, y) норму L2 або відстань, тобтоx1,xnθminθR(E(θ,x1,xn)=minθR(i=1i=nE(θ,xi))E(x,y)=(xy)2 тоді мінімізатор для всіх - середнє значення. Якщо можна пройти відстань L1 або Манхеттен, мінімізатор для всіх є медіаною. Таким чином, середнє значення є природним математичним вибором - якщо використовується відстань L2!θRθR


6
Оскільки широко використовується для позначення очікування , пропоную замінити на, скажімо, . EEErr
Річард Харді

3
Можливо, варто зазначити, що є диференційованим при тоді якне. На мою думку, це тонка, але ключова причина, чому МСЕ є більш поширеним на арені математичної статистики, ніж МАЕ. x2x=0|x|
Just_to_Answer

1
@Just_to_Answer - Я думаю, що це ще одна причина. Я багато років про це думав. Для мене я зробив висновок, що те, що ви говорите, пов'язане з тим, чому ми зазвичай використовуємо евклідову, а не манхеттенську відстань :)
aginensky

19

Часто середнє значення вибирається за медіаною не тому, що воно є більш репрезентативним, надійним або значущим, а тому, що люди плутають оцінювач з оцінкою. По-іншому, деякі вибирають середнє значення сукупності як кількість, що цікавить, тому що при нормальному розподілі середнє значення вибірки є більш точним, ніж медіана вибірки. Натомість вони повинні більше думати, як ви робили, про справжню кількість інтересів.

Одна бічна панель: у нас є непараметричний інтервал довіри для медіани популяції, але не існує непараметричного методу (крім, можливо, чисельно інтенсивного емпіричного методу ймовірності), щоб отримати довірчий інтервал для середньої сукупності. Якщо ви хочете залишитися без розповсюдження, ви можете зосередитись на медіані.

Зауважимо, що теорема про центральний межа набагато менш корисна, ніж здається, про що йшлося в інших місцях на цьому сайті. Це фактично передбачає, що дисперсія відома або що розподіл симетричний і має форму, таку дисперсію вибірки є конкурентним оцінником дисперсії.


2
Я вважаю, що можна побудувати непараметричний довірчий інтервал для середнього значення - скажімо, через тест на перестановку (це можна зробити при допущенні симетрії, не приймаючи, наприклад, жодної конкретної функціональної форми). Це дещо обмежена ситуація, хоча це можливо і за інших припущень, ніж симетрія. Якщо ви готові розібратися з приблизним покриттям, яке відбувається із завантаженням, ви можете отримати непараметричні інтервали без припущень, як симетрія.
Glen_b -Встановити Моніку

2
Якщо передбачається симетрія, вона є параметричною. Не бачив, щоб це поширювалося на несиметричні випадки. Запуск завантажувального пристрою (усі варіанти, за винятком, можливо, студійного методу t) є надзвичайно неточним при сильній асиметрії. Дивіться stats.stackexchange.com/questions/186957
Френк Харрелл

5
Симетрія не є кінцево-параметричною. Тест, підписаний Вілкоксоном, передбачає симетричність (щоб мати можливість заміни знаків) під нулем. Ви б назвали цей параметричний?
Glen_b -Встановіть Моніку


2
Питання @Glen_b про симетрію - це відмінне запитання. Тест підписаного рангу Вілкоксона є цікавим випадком, тому що, на відміну від тесту WIlcoxon 2-зразок, робить важке припущення щодо симетрії. Я думаю, ви могли б сказати, що ви можете бути непараметричними, але все ж вимагаєте якогось загального припущення, такого як симетрія. Може бути, термінологія має бути "непараметричною з обмеженнями"? З іншого боку, непараметричний тест на 2 зразки має обмеження щодо того, що оптимізує помилку II типу (але не помилку I типу).
Френк Харрелл
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.