Якщо середнє значення є настільки чутливим, навіщо його використовувати в першу чергу?


84

Відомий факт, що медіана є стійкою до сторонніх людей. Якщо це так, коли і навіщо ми б в першу чергу вживали середину?

Можливо, я можу подумати, щоб зрозуміти присутність людей, що випадають, тобто якщо медіана далеко не середня, тоді розподіл перекошений і, можливо, дані потрібно вивчити, щоб вирішити, що робити з людьми. Чи є якісь інші види використання?


14
Щодо першого питання, швидке побічне зауваження: Середнє значення в статистиці - це лише перший момент популяції , тоді як медіана - ні. Прагнучи використовувати CLT, закон великої кількості тощо, ви знову пов'язані з існуванням кінцевих моментів. Хоча взяти за приклад розподіл Коші: медіана існує, а середнього немає;)
Дмитро Челов

2
@Dmitrij Це глибока і глибока відповідь. Чому ви не деталізуєте це у відповіді?
whuber

Якби ви не вживали середини, ви б зашкодили її почуттям? (Вибачте, не втримався.)
Даніель Р Хікс

3
@Daniel R Хікс: І це цілком криво, чи не так? (Вибачте, також не втримався).
Мухаммед Алкароурі

3
Це питання набагато цікавіше звичайного: "Як ми не завжди використовуємо надійні алгоритми?" питання, але може бути те саме, що думає, що "надійний == магічний", і якщо ми просто використовували надійні методи, нам не доведеться вивчати наші дані, розуміти їх або турбуватися про різні види точності, оскільки вони "міцний". Все-таки +1.
Уейн

Відповіді:


113

У певному сенсі середнє використовується, оскільки воно чутливе до даних. Якщо розподіл буває симетричним і хвости приблизно схожі на звичайний розподіл, середня величина є дуже ефективним підсумком центральної тенденції. Медіана, хоча є надійною і чітко визначеною для будь-якого безперервного розподілу, є лише настільки ж ефективною, як середнє значення, якщо дані трапляються від звичайного розподілу. Саме ця відносна неефективність медіани утримує нас від її використання навіть більше, ніж ми. Відносна неефективність перетворюється на незначну абсолютну неефективність, оскільки розмір вибірки стає більшим, тому для великих ми можемо бути більш винуватими щодо використання медіани. n2πn

Цікаво відзначити, що для міри варіації (поширення, дисперсії) існує дуже надійний оцінювач, який на 0,98 є настільки ж ефективним, як і стандартне відхилення, а саме середня різниця Джині. Це середня абсолютна різниця між будь-якими двома спостереженнями. [Ви повинні помножити вибіркове стандартне відхилення на постійну, щоб оцінити ту саму величину, оцінену за середньою різницею Джіні.] Ефективним показником центральної тенденції є оцінка Ходжеса-Леманна, тобто медіана всіх парних засобів. Ми б використовували його більше, якби його тлумачення було більш простим.


13
+1 для згадки оцінки Ходжеса-Леманна центральної тенденції. Багато в чому це середнє та середнє значення. Якби це було легко обчислити у великій вибірці, я би вважав, що це буде популярнішим, ніж середнє значення або медіана як міра розташування, я думаю.
ttnphns

BTW, @Frank, чи знаєте ви, з якого теоретичного розподілу вибірки слід центр Ходжеса-Леманна? Я ні - і цікавлюсь.
ttnphns

16
Дякуємо за коментар Один вкладиш в R може обчислити його ефективно до N = 5000: w <- outer(x, x, '+'); median(w[row(w) >= col(w)])/2. Тривіальна програма C, Fortran або Ratfor може бути викликана R, щоб зробити це швидко. Пакет ICSNP в R має досить ефективну реалізацію зі своєю hl.locфункцією. Для N = 5000 це було в 2,66 рази швидше, ніж вищевказаний код (загальний час 1,5 сек). Було б добре також ефективно отримати інтервал довіри.
Френк Харрелл

@FrankHarrel, що ви можете сказати про оцінки та для стандартного відхилення? Яку константу слід використовувати для оцінки використовуючи середню різницю Джіні для ненормативних розподілів? Я не міг знайти паперів, які описують процедуру обчислення цієї константи у джерелах відкритого доступу ... Також я не знайшов жодної інформації про надійність середньої різниці Джині, чи можете ви дати ідею, де її шукати? Q n σSnQnσ
Німець Демидов

1
Ми говоримо про дисперсійні заходи, тому порівняння моделей не викликає сумнівів (і не плутайте з "індексом Джині"). Середня різниця Джині - абсолютна міра. Це легше інтерпретувати, ніж інші заходи. Той факт, що вам потрібно буде обчислити різну константу для кожного розподілу, говорить мені, що ми не хочемо використовувати константу.
Френк Харрелл

36

Уже багато чудових відповідей, але, зробивши крок назад і отримати трохи більш основне, я б сказав, що це тому, що відповідь, яку ви отримаєте, залежить від питання, яке ви задаєте. Середня і медіана відповідають на різні запитання - іноді одне підходить, інше - інше.

Неважко сказати, що медіану слід використовувати, коли є аутлієри, або для косого розподілу, або будь-якого іншого. Але це не завжди так. Візьміть дохід - майже завжди повідомляється з медіаною, і зазвичай це правильно. Але якщо ви дивитесь на витрату цілої громади, це може бути не правильно. І в деяких випадках навіть режим може бути найкращим (особливо, якщо дані згруповані).


8
+1 за очевидний момент, до якого, схоже, ніхто не звертається: вони різні поняття і відповідають на різні запитання. Крім того, у багатьох випадках багато втрачається за рахунок конденсації всього розподілу на одне підсумкове число, тому іноді вони обидва виконують тугу роботу.
Майкл МакГоуан

25

Коли цінність є сміттям для нас, ми називаємо це "стороннім" і хочемо, щоб аналіз був надійним до нього (і віддаємо перевагу медіану); коли це саме значення є привабливим, ми називаємо це "крайнім" і хочемо, щоб аналіз був чутливим до нього (і віддав перевагу середньому). Діалектика ...

Середовище однаково реагує на зміну значення незалежно від того, де в розподілі відбувається зсув. Наприклад, 1 2 3 4 5ви можете збільшити будь-яке значення на 2 - середнє збільшення буде однаковим. Реакція медіани менш "послідовна": додайте 2 до точок даних 4 або 5, і медіана не посилиться; але додайте 2 до пункту 2 - так що зсув буде перебіг медіани, а медіана різко зміниться (значно більше, ніж буде змінено середнє значення).

Середній завжди точно розташований. Середній не є; наприклад, у множині 1 2 3 4 будь-яке значення між 2 і 3 можна назвати середнім. Таким чином, аналізи на основі медіанів не завжди є унікальним рішенням.

Середнє значення - це місце мінімальних відхилень суми квадрата. Багато завдань оптимізації на основі лінійної алгебри (включаючи відому регресію OLS) мінімізують цю помилку в квадраті і, отже, передбачають поняття середнього значення. Середній локус мінімальних відхилень суми абсолютних відхилень. Методи оптимізації для мінімізації такої помилки є нелінійними та є більш складними / мало відомими.


2
+1 Я мало занепокоєний тим, що перший абзац може бути неправильно зрозумілий, оскільки передбачає виявлення зовнішнього вигляду - це повністю суб'єктивний процес. Я не думаю, що ти це маєш на увазі.
whuber

8
+1 | Я думаю, що з першого речення випливає, що застосування виявлення зовнішнього вигляду є повністю суб'єктивним, і тому я голосую за те, щоб як слід.
Іван

2
Я мав на увазі, що виявлення чужорідності - це сувора процедура з суб'єктивними філософськими чи моральними коріннями
ttnphns

3
@ttnphns, написання "пережитий" замість "чужий" є навмисним, чи ні?
mpiktas

1
Ненавмисний друк.
ttnphns

16

Відповідей на це питання дуже багато. Ось такий, який ви, мабуть, не побачите в іншому місці, тому я включаю його сюди, тому що я вважаю, що це стосується цієї теми. Люди часто вірять, що оскільки медіана вважається надійною мірою стосовно людей, що не належать до людей, що вона також є надійною для більшості всього. Насправді це також вважається надійним упередженням у перекошених розподілах. Ці два стійкі властивості медіани часто навчаються разом. Можна відзначити, що основні перекошені дистрибуції також мають тенденцію до отримання невеликих зразків, схожих на те, що у них є вищі люди, а загальноприйнята мудрість полягає в тому, що в таких ситуаціях можна використовувати медіанів.

#function to generate random values from a skewed distribution
rexg <- function (n, m, sig, tau) {
    rexp(n, rate = 1/tau) + rnorm(n, mean = m, sd = sig)
    }

(лише демонстрація того, що це перекос і основна форма)

hist(rexg(1e4, 0, 1, 1))

сюжет

Тепер давайте подивимося, що станеться, якщо ми виберемо з цього розподілу різні розміри вибірки та обчислимо медіану та маємо на увазі, що таке різниці між ними.

#generate values with various n's
N <- 1e4
ns <- 2:30
y <- sapply(ns, function(x) mean(apply(matrix(rexg(x*N, 0, 1, 1), ncol = N), 2, median)))
plot(ns,y, type = 'l', ylim = c(0.85, 1.03), col = 'red') 
y <- sapply(ns, function(x) mean(colMeans(matrix(rexg(x*N, 0, 1, 1), ncol = N))))
lines(ns,y)

сюжет2

Як видно з наведеного сюжету, медіана (червоним кольором) набагато більш чутлива до n, ніж середня. Це суперечить деякій загальноприйнятій мудрості щодо використання медіанів із низьким рівнем ns, особливо якщо розподіл може бути перекошеним. І це підкреслює те, що середнє значення є відомим значенням, а медіана чутлива до інших властивостей, одна з яких - n.

Цей аналіз схожий на Miller, J. (1988). Попередження про середній час реакції. Журнал експериментальної психології: сприйняття та ефективність людини , 14 (3): 539–543.

РЕВІЗІЯ

Розмірковуючи над проблемою перекосу, я вважав, що вплив на медіану може бути лише тому, що в невеликих вибірках більша ймовірність того, що медіана знаходиться в хвості розподілу, тоді як середнє значення майже завжди буде зважене на значення, ближчі до значення режим. Тому, можливо, якщо хтось просто брав вибірки з вірогідністю випускників, то, можливо, відбудуться ті самі результати.

Тож я подумав про ситуації, коли можуть виникнути люди, що переживають люди, і експериментатори можуть спробувати їх усунути.

Якщо випадкові випадки трапляються послідовно, наприклад, у кожному окремому відборі даних, то медіани стійкі до ефекту цієї чужої людини, і звичайна історія використання медіанів має місце.

Але зазвичай це не відбувається.

Можна виявити чужий в дуже мало клітинок експерименту і вирішити використовувати медіану замість середнього в цьому випадку. Знову ж таки, медіана є більш стійкою, але її фактичний вплив порівняно невеликий, оскільки людей, які переживають мало часу, дуже мало. Це, безумовно, був би більш поширений випадок, ніж той, що описаний вище, але ефект від використання медіани, ймовірно, буде настільки малим, що це мало би мало значення.

Можливо, більш часто люди, що випадають, можуть бути випадковим компонентом даних. Наприклад, справжнє середнє та стандартне відхилення сукупності може становити приблизно 0, але є відсоток часу, який ми відбираємо з популяції, що перебуває поза межами, де середнє значення 3. Розглянемо наступне моделювання, де саме така популяція відбирається, змінюючи вибірку розмір.

#generate n samples N times with an outp probability of an outlier.
rout <- function (n, N, outp) {
    outPos <- sample(0:1,n*N, replace = TRUE, prob = c(1-outp,outp))
    numOutliers <- sum(outPos)
    y <- matrix( rnorm(N*n), ncol = N )
    y[which(outPos==1)] <- rnorm(numOutliers, 4)
    return(y)
    }

outp <- 0.1
N <- 1e4
ns <- 3:30
yMed <- sapply(ns, function(x) mean(apply(rout(x,N,outp), 2, median)))
var(yMed)
yM <- sapply(ns, function(x) mean(colMeans(rout(x,N,outp))))
var(yM)
plot(ns,yMed, type = 'l', ylim = range(c(yMed,yM)), ylab = 'Y', xlab = 'n', col = 'red') 
lines(ns,yM)

результати

Медіана - червона, середня - чорна. Це схожий висновок зі скасованим розподілом.

У відносно практичному прикладі використання медіанів для уникнення наслідків, що втратили люди, можна створити ситуації, коли на оцінку впливає n набагато більше, коли використовується медіана, ніж коли використовується середнє значення.


Гарний приклад, але це дійсно залежить від розподілу. Якщо ви використовуєте звичайний або рівномірний розподіл, графік сильно відрізняється, накладаючи два рядки. Різниця виробляє саме експоненціальний розподіл.
nico

1
-1 Ця відповідь плутає "чутливість" з "упередженістю".
whuber

4
Значно краще; Я зняв протилежну заяву. Але мене заінтригує нове пояснення: чи не могли б ви вказати якесь джерело - текст, папір або веб-сайт - що насправді робить твердження «[медіана] також вважається стійкою до упередженості у перекошених дистрибутивах» і пояснює що це може означати? Я раніше не наштовхувався на таку претензію і не впевнений, що це насправді говорить.
whuber

3
Це більше народних знань для боротьби з часом реакції (як відомо, перекошеною) в психологічних дослідженнях. Я посилаюся на документ, який спростовує народну мудрість в психології (що мені погано, якщо я не згадувався раніше).
Іван

3
BTW, незважаючи на газету Міллера (1988), люди все ще використовують середні часи реакції в дослідженнях з імовірнісними маніпуляціями, коли умови мають різну кількість проб, а нижній - як правило, невеликий.
Іван

11
  • З середнього значення легко обчислити суму по всіх предметах, наприклад, якщо ви знаєте середній дохід населення та чисельність населення, ви можете відразу підрахувати загальний дохід всього населення.

  • Середнє значення просто обчислити у O(n)часовій складності. Обчислити медіану за лінійним часом можливо, але потрібно більше продумати. Очевидне рішення, що вимагає сортування, має гіршу ( O(n log n)) часову складність.

І я припускаю, що є ще одна причина того, що середнє значення є більш популярним, ніж медіана:

  • Середній викладається для більшої кількості людей у ​​школі, і це, мабуть, викладається перед викладанням медіани

Для вашого часу складності залежить від того, як зберігаються значення. Якщо значення вже відсортовані, то, безумовно, можна обчислити медіану в найгіршому випадку складності часу O (1).
luiscubal

Я погоджуюся - її застосовність у розрахунках, як сума, є однією з головних переваг середнього. Хоча я часто віддаю перевагу медіані, коли мета полягає в тому, щоб щось описати, ми часто використовуємо середнє значення, коли воно є введенням для іншого обчислення.
Джонатан

5

"Відомо, що медіана є стійкою до людей, що втрачають пережиток. Якщо це так, то коли і чому ми б в першу чергу вживали середнє значення?"

У тих випадках, коли відомо, що немає інших людей, наприклад, коли вони знають процес генерації даних (наприклад, у математичній статистиці).

Слід зазначити тривіальне, що ці дві величини (середня та медіана) насправді не вимірюють одне й те саме, і більшість користувачів запитують перше, коли те, що їм насправді повинно бути зацікавлене в останньому (це добре проілюстровано середні тести Вілкоксона, які легше інтерпретуються, ніж t-тести).

Тоді, є випадки, коли з тієї чи іншої причини випадків якесь регулювання нав'язує використання він означає.


2

Якщо стурбованість викликає наявність людей, що переживають люди, існує декілька прямих способів перевірити свої дані.

Працівники, майже за визначенням, потрапляють до наших даних, коли щось змінюється або в процесі генерації даних, або в процесі збору даних. тобто дані перестають бути однорідними. Якщо ваші дані неоднорідні, то ні середня, ні медіана не мають великого сенсу, оскільки ви намагаєтеся оцінити центральну тенденцію двох окремих наборів даних, які були змішані разом.

Найкращим методом забезпечення однорідності є вивчення процесів генерування даних та збирання даних, щоб переконатися, що всі ваші дані надходять із єдиного набору процесів. Тут нічого не б'ється трохи мозку.

У якості вторинної перевірки ви можете звернутися до одного з декількох статистичних тестів: хі-квадрат, Діксонів Q-тест, тест Грубба або контрольна діаграма / діаграма поведінки процесу (зазвичай X-бар R або XmR). Мій досвід полягає в тому, що, коли ваші дані можуть бути впорядковані по мірі їх збирання, графіки поведінки процесів краще виявляти людей, що не випадають, ніж тести, що використовуються. Це використання для діаграм може бути дещо суперечливим, але я вважаю, що цілком відповідає оригінальному наміру Шеуарта, і це використання, яке явно виступає Дональд Уілер. Незалежно від того, чи використовуєте ви випробування на чужорідне життя або діаграми поведінки процесу, пам’ятайте, що виявлений «чужий» - це лише сигнал про потенціалнеоднорідність, яку потрібно додатково вивчити. Рідко має сенс викидати точки даних, якщо у вас немає пояснень, чому вони були пережилими.

Якщо ви використовуєте R, пакет " outliers" надає тести, що випадають , а для діаграм поведінки процесу є qcc , IQCC і qAnalyst. Я маю особисті переваги щодо використання та виходу пакету qcc.


2

Коли ви хочете середини?

Приклади з фінансів:

  • Повернення облігацій:
    • Середня віддача облігацій, як правило, становитиме кілька відсоткових пунктів.
    • Середня віддача облігацій може бути низькою або високою залежно від ставки за замовчуванням та відновлення за замовчуванням. Медіана проігнорує все це!
    • Вдало пояснюючи Вашим інвесторам: "Я знаю, що наш фонд зменшився на 40% цього року, оскільки майже половина облігацій розпалася без відновлення, але наша середня облігація повернула 1%!"
  • Прибутковість венчурного капіталу:
    • Те ж саме у зворотному напрямку. Середня VC або ангельська інвестиція - це бюст, і все повернення приходить від кількох переможців! (Побічна примітка / попередження: оцінки венчурного капіталу або повернення приватного капіталу вкрай проблематичні ... будьте уважні!)

Формуючи диверсифікований портфель, вирішуючи, в що інвестувати і скільки, середня величина та коваріантність прибутковості, ймовірно, важливо враховуватимуть вашу проблему оптимізації.


Погоджено, але, схоже, середнє значення або медіана не є зосередженою у жодній із цих ситуацій: швидше, підсумки можуть бути ключовими величинами. Звичайно, це означає, що такі засоби будуть кращими резюме, ніж медіани. Але за умови, що посереднє повернення облігацій може бути дурною відповіддю, але хтось пропонує?
Нік Кокс

@NickCox Два коментарі. (1) У тому, що серединна віддача облігацій є дурною - справа! У цих відповідях є чудова теорія, але я подумав, що надзвичайно простий приклад може додати трохи кольору. Напрошуючи відповідь Франка, "середнє значення використовується тому, що воно чутливе до даних", а повернення портфеля дає просту, зрозумілу ситуацію, коли ви цього хочете. (2) Різниця між турботою про "загальне" проти турботою про "середнє" може стати досить туманною. "Чи варто інвестувати у хедж-фонд?" Щоб відповісти на це, можливо, я хотів би знати, "що означає повернення хедж-фондів?"
Меттью Ганн

1
(1) Я згоден, як сказано; моє запитання лише в тому, чи медіана серйозно згадується у навчальній чи дослідницькій літературі з цією метою. (2) Я не вважаю, що мій погляд не туманний; це просте питання, що перше, тобто є первинним інтересом практично. Я бачу заголовки "банди у в'язниці загалом за 200 років", і я знаю, чому вони надруковані, але все-таки це дивний спосіб узагальнення. І навпаки, 200 загиблих у серії катастроф є первинними, а не 5 катастроф із середнім значенням 40 загиблих у кожній. (Невелике) питання вибирає, який зведений виклад є найбільш підходящим.
Нік Кокс

@ NickCox Point прийнято. Я згоден, що ви дбаєте про загальну суму власних інвестицій. Формуючи портфель та визначаючи вагу портфеля за певними цінними паперами, ви будете дбати про властивості повернення цієї цінної папери. Я не збираюся купувати ВСІ муніципальні облігації, я не переймаюся безпосередньо загальною сумою, але мені все одно, яка середня віддача на облігації? Які властивості ризик / повернення, якщо я додавав кілька до свого портфоліо?
Меттью Ганн

Домовились. Ось тут територія.
Нік Кокс
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.