Чому факт, що 1 медіана нижчий, ніж інший медіани, не означає, що більшість у групі 1 менше, ніж більшість у групі 2?


9

Я вважав, що розроблені нижче скриньки можна інтерпретувати як "більшість чоловіків швидше, ніж більшість жінок" (у цьому наборі даних), насамперед тому, що середній час чоловіків був меншим, ніж середній час жінок. Але курс EdX на R та статистику вікторини сказав мені, що це неправильно. Будь ласка, допоможіть мені зрозуміти, чому моя інтуїція неправильна.

Ось питання:

Розглянемо випадкову вибірку фінішерів з Нью-Йоркського марафону в 2002 році. Цей набір даних можна знайти в пакеті UsingR. Завантажте бібліотеку та завантажте набір даних nym.2002.

library(dplyr)
data(nym.2002, package="UsingR")

Використовуйте боксплоти і гістограми для порівняння часу закінчення чоловіків і жінок. Що з наведеного найкраще описує різницю?

  1. Самці і жінки мають однакове поширення.
  2. Більшість чоловіків швидше, ніж більшість жінок.
  3. Самець і самки мають схожі праворуч коси розподіли з колишнім, на 20 хвилин зміщені вліво.
  4. Обидва розподілу зазвичай розподіляються із середньою різницею приблизно 30 хвилин.

Ось NYC марафонські часи для чоловіків і жінок, як квантили, гістограми та боксплоти:

# Men's time quantile
      0%      25%      50%      75%     100% 
147.3333 226.1333 256.0167 290.6375 508.0833

# Women's time quantile
      0%      25%      50%      75%     100% 
175.5333 250.8208 277.7250 309.4625 566.7833

Чоловічий і жіночий час - гістограма

Чоловічі та жіночі часи - боксплот


Щоб візуально перевірити наявність одного і того ж розподілу, ваші гістограми повинні використовувати один і той же домен x і bins, тоді як вісь y повинна показувати відносну частоту. Розмір смуги для сміття виграв би з більш високою деталізацією, наприклад, 25 або 50 хвилин. Крім того, на обох і гістограмах намалюйте медіану (вже в коробці), середнє значення та режим.
g3o2

Перегляньте запитання із назви: розгляньте рівномірні розподіли на та . Медіана останнього більша, але з урахуванням випадкової реалізації від кожної, ймовірність того, що друга є більшою, така ж, як і менша ( ). Отже, якщо ви визначаєте "більшість більше" за "даними двома випадковими вибірками X і Y, по одному від кожного, ", співвідношення між медіанами X і Y не говорить про це багато. {0,3}{2}0.5P(X>Y)>0.5
AlexR

Відповіді:


7

Я думаю, що причина, яку ви позначили як неправильну, полягає не в тому, що відповідь, яку ви дали на багатоголосове запитання, була помилковою, а в тому, що варіант 3 "Чоловіки і жінки мають подібні правильні перекошені розподіли з попередніми, на 20 хвилин зміщені вліво" був би кращим вибором, оскільки він більш інформативний на основі наданої інформації.


Я згоден з цим поясненням. Крім того, «швидше, ніж більшість» настільки неоднозначно. Незважаючи на відповідь, надану @glen_b, я очікував би набагато більше розділення у графі графі для цього виду. Як і "всі 75% чоловіків швидші, ніж усі 75% жінок", що, на мою думку, це означало б, що 75-й відсоток чоловічих разів був меншим, ніж 25-й перцентил жіночих разів. Але мова неоднозначна.
Sal Mangiafico

1
Також це стосується принципу прийняття тестів з декількома варіантами вибору: Завжди вибирайте найкращу відповідь.
Sal Mangiafico

Це має сенс; Справа не в тому, що другий вибір був НЕПРАВНИМ, а в тому, що правильний вибір ("Чоловіки і жінки мають подібні правильні перекошені розподіли з колишнім, на 20 хвилин зміщені вліво") був вірніше. Однак я не дуже бачу 20-хвилинну зміну в гістограмах; мені це більше схоже на 50-хвилинну зміну. Оскільки у мене було два шанси, я зрозумів питання правильно, FWIW :-).
кмин

@cumin: Я не впевнений, що насправді це правильно. "Більшість чоловіків швидше, ніж більшість жінок" невизначено, що означає "більшість" - я не вірю, що я коли-небудь бачив суворе визначення, і інтуїтивно це зазвичай значно більше 50% (можливо, 70% +?) . Якби вони сказали "більшість", то, можливо, було б зрозуміліше.
користувач541686

9

Ось найменший зустрічний приклад, який я міг знайти:

А 1,4,10;  Б 0,6,9

  • A ( [1, 4, 10])і B ( [0, 6, 9]) мають однаковий середній ( 5)

  • B має більшу медіану ( 6), ніж A ( 4)

  • Існує 5/9 ймовірність того, що випадковий елемент A більший, ніж випадковий елемент B.

Ось ще один приклад з 4 елементами:

А 1,1,3,10;  Б 0,0,6,9


7

"Більшість чоловіків швидші, ніж більшість жінок", можливо, є дещо неоднозначним, але я, як правило, інтерпретую його намір таким чином, що якщо ми подивимось на випадкові пари, більшість часу чоловік буде швидшим - тобто для випадкових (де - "час для -го чоловіка" тощо).P(Mi<Fj)>12i,jMii

Звичайно, можливі й інші тлумачення фрази (ось, в чому полягає неоднозначність, зрештою), і деякі з цих інших можливостей можуть відповідати вашим міркуванням.

[У нас також є питання, чи говоримо ми про вибірки чи популяції ... "більшість чоловіків [...] більшість жінок", схоже, є твердженням про населення (про населення потенційних часів), але ми спостерігали лише часи що ми, здається, розглядаємо як зразок, тому ми повинні бути обережними з тим, наскільки широко ми заявляємо претензію.]

Зауважте, що не мається на увазі через . Вони можуть йти в протилежні сторони.P(Mi<Fj)>12M~<F~

[Я не кажу, що ви помиляєтесь, думаючи, що частка випадкових пар МФ, де чоловік був швидшим за жінку, перевищує 1/2, - ви майже напевно правильні. Я просто кажу, що ви не можете цього сказати, порівнюючи медіанів. Ви також не можете цього сказати, дивлячись на частку в кожному зразку вище або нижче медіани іншого зразка. Вам доведеться зробити інше порівняння.]

Тобто, хоча середній чоловік може бути швидшим за медіанну жінку, можливо, мати вибірку разів (або безперервний розподіл разів, в цьому питанні), де шанс, що випадковий чоловік швидший, ніж випадкова жінка, є менше , ніж . У великих пробах два протилежних показання можуть бути вагомими.12


Приклад:

Набір даних A:

 1.58  2.10 16.64 17.34 18.74 19.90  1.53  2.78 16.48 17.53 18.57 19.05
 1.64  2.01 16.79 17.10 18.14 19.70  1.25  2.73 16.19 17.76 18.82 19.08
 1.42  2.56 16.73 17.01 18.86 19.98

Набір даних B:

 3.35  4.62  5.03 20.97 21.25 22.92  3.12  4.83  5.29 20.82 21.64 22.06
 3.39  4.67  5.34 20.52 21.10 22.29  3.38  4.96  5.70 20.45 21.67 22.89
 3.44  4.13  6.00 20.85 21.82 22.05

Набір даних C:

 6.63  7.92  8.15  9.97 23.34 24.70  6.40  7.54  8.24  9.37 23.33 24.26
 6.18  7.74  8.63  9.62 23.07 24.80  6.54  7.37  8.37  9.09 23.22 24.16
 6.57  7.58  8.81  9.08 23.43 24.45

(Дані є тут , але вони використовуються для іншої мети там - на мій спогад, я створив цей сам)

Зауважимо, що частка A <<B становить 2/3, частка A <C - 5/9, а частка B <C - 2/3. І А, і В, і В проти С є значущими на рівні 5%, але ми можемо досягти будь-якого рівня значущості, просто додавши достатню кількість копій зразків. Ми навіть можемо уникнути зв’язків, дублюючи зразки, але додаючи досить крихітний тремтіння (достатньо менший за найменший проміжок між точками)

Медіани вибірки йдуть в іншому напрямку: медіана (A)> медіана (B)> медіана (C)

Знову ми могли досягти значущості для порівняння медіанів - до будь-якого рівня значущості - шляхом повторення зразків.

Стрип-схеми зразків A, B і C з медіанами, позначеними, що показують P (A <B) у зворотному напрямку до медіанів тощо

Щоб пов’язати це з цією проблемою, уявіть, що А - це "часи жінки", а В - "часи чоловіків". Тоді середній час чоловіків проходить швидше, але випадково вибраний чоловік буде на 2/3 часу повільніше, ніж випадково обрана жінка.

Беручи набір сигналів із зразків A і C, ми можемо генерувати більший набір даних (в R) наступним чином:

n <- 300
F <- c(runif(n/3,0,5),runif(n-n/3,15,20))
M <- c(runif(n-n/3,7.5,12.5),runif(n/3,22.5,27.5))

Медіана F становитиме близько 16,25, тоді як медіана M буде приблизно 11,25, але частка випадків, коли F <M, буде 5/9.

[Якщо ми замінили n / 3 біноміальною змінною з параметрами та ми б вибірку з популяції, де медіана розподілу F становить 16,25, а медіана розподілу M - 11,25. Тим часом у цій популяції ймовірність того, що F <M знову буде 5/9.]n13

Зауважимо також, що і а (на значну відстань).P(F<med(M))=23P(M>med(F))=23med(M)<med(F)


Я бачу, як засоби можуть йти в протилежних напрямках, але я визнаю, що моя інтуїція тут відповідає ОП. Я не бачу, як медіани можуть (окрім проблеми помилки вибірки).
gung - Відновіть Моніку

@gung Я включив приклад. Я люблю підробляти свої початкові інтуїції таким чином - знаходячи протилежні приклади до них. Якщо я зустріну більше (я вважаю, що у мене є десь інше), я спробую згадати їх.
Glen_b -Встановити Моніку

Запропоноване питання щодо оригіналу показує, що приблизно 60-65% (за допомогою очного яблука) чоловіків мають час, менший за середній час для жінок (тобто менше, ніж час для 50% жінок). Це той твір, який я хотів би пояснити далеко.
кмин

@cumin у моїх зразках A і C вище, на 2/3 C є менше середньої для A (більшість C швидше, ніж медіана A), тоді як для випадковихP(Ai<Cj)i,jстановить близько 56% (більшість випадків випадковий A б'є випадковий C). [Я не думаю, що ваш висновок насправді невірний щодо ваших даних, просто цього лише інформації не вистачило б для її встановлення.] - Я зробив невеличку редакцію в кінці свого повідомлення про цю конкретну інформацію порівняння. Думаю, було б дуже важко одночасно зіставити деталі у ваших гістограмах та скриньках і отримати такий вид розвороту, який я сконструював
Glen_b -Встановити Моніку

3
Я б інтерпретував фразу "більшість чоловіків швидші за більшість жінок" як "принаймні 50% чоловіків швидше, як мінімум, 50% жінок". Іншими словами: даючи чоловікові X, має сенс запитати, чи швидше Х 50, ніж жінки. Як мені здається, заява говорить про те, що принаймні 50% чоловіків мають цю властивість. Це (я думаю) ПРАВИЛЬНА, якщо медіана чоловіка швидша за медіану, оскільки 50% чоловіків були б швидшими за медіану, яка швидша за медіану, яка швидше, ніж 50% жінок. (Але зауважте, що це стосується лише 25% пар жінок-чоловіків, що, я думаю, пояснює ваш чудовий приклад.)
mathmandan

3

Наступні малюнки взяті з цієї публікації в блозі , що ілюструє важливе практичне застосування цих ідей.

Стандартизація забезпечує потужний пристрій для порівняння двох дистрибутивів. На наступних трьох показниках порівнюються висоти 130-місячних хлопчиків та дівчаток з Національної програми вимірювання дітей у Англії (NCMP). (Це модальний вік у цьому наборі даних; я вибрав його просто для отримання максимальної кількості даних, а отже, і найгладших сюжетів у межах однієї вікової групи.)

Рисунок 1: Висота хлопчиків і дівчаток у віці 130 місяців з Національної програми вимірювання дітей у Англії (NCMP)

Рисунок 1: Висота хлопчиків і дівчаток у віці 130 місяців з Національної програми вимірювання дітей у Англії (NCMP)

Малюнок 2: Відсотки зросту для хлопчиків і дівчаток у віці 130 місяців.  Джерело: англійська NCMP

Малюнок 2: Відсотки зросту для хлопчиків і дівчаток у віці 130 місяців. Джерело: англійська NCMP

Малюнок 3: Розподіл висот дівчат 130-місячного віку відносно хлопців того ж віку.

Малюнок 3: Розподіл висот дівчат 130-місячного віку відносно хлопців того ж віку.

В останній з цих цифр порівняння висоти було стандартизоване відповідно до висоти хлопчиків. Таким чином, читаючи уздовж пунктирних сірих рядків на рисунку 3, ви можете робити такі твердження, як:

  • Середній (тобто 50-процентний) зріст для хлопчиків становить приблизно 45-й відсоток для дівчаток. Таким чином, 100% - 45% = 55% дівчат були вищими, ніж середній хлопчик.
  • Висота верхнього кварталу (75 відсотків) для дівчаток досягає верхнього квінтилі (80-го перцентиля) для хлопчиків. Таким чином, серед дітей у віці 130 сотень дівчинка, яка перевищує 3 з 4 дівчаток, також вища, ніж 4 з 5 хлопчиків.

Один момент можливої ​​плутанини в цьому сюжеті заслуговує на згадку. Хоча лінія хлопчика на 45 ° на графіку "вище", ніж крива пурпурної дівчини, це спостереження все-таки відповідає загальновідомому факту, що в цьому віці (це шестикласники) дівчата, як правило, вище, ніж хлопчики . Зауважте, що ця високість належним чином відображається в тому, що крива пурпурової форми зміщена вправо відносно синьої лінії.

Цей підхід є досить загальним . За такого порівняння одна з груп - та, до якої ви стандартизуєтесь - стає лінією 45 °. Інша група, як правило, може бути будь-якою монотонною кривою, що збільшується, намальованою знизу зліва вгорі праворуч. За умови, що основні розподіли безперервні (у щільності відсутні точкові маси), порівняна крива буде безперервною. Якщо основні щільності мають однакову підтримку , крива повинна запускатися з(0,0) до (1,1).

Ваше первісне запитання тепер може бути перероблене в геометричному плані, як питання про те, чи можна було б намалювати пурпурову криву рисунку 3, щоб одночасно досягти (a) постульованого відношення між медіанами та (b) злегка невловимого відношення, яке @Glen_b з'ясований (правильно я вважаю) у своїй відповіді. Цікаво, чи можуть розриви розподілу (маси точок у густинах) можуть забезпечити «патологічний» випадок. Я гадаю, що будь-який подібний патологічний випадок стане «винятком, який підтверджує правило».


Якщо ви можете зробити найпростіший, логічний переклад вашого питання вікторини на більш офіційну мову, придатний до аналізу, то (використовуючи налаштування дитячих висот зверху), ми можемо хотіти сказати людині x має властивість TMB, якщо xє т Aller , ніж м ост б OYs. Тоді у вашому запитанні для вікторини просто задали, чи має більшість дівчат властивість TMB . Якщо хтось визначає, що "найбільше" означає більше половини , то властивість TMB означає бути вище, ніж хлопчик середньої висоти. Запитання, чи має більшість дівчат властивість ТМВ, то зводиться до запитання, чи має середня дівчина ця властивість. На цей рахунок відповідь на питання вікторини буде так .

З іншого боку, якщо фактичний задум "більшості" становив "> 50%", можна очікувати використання більш точної фрази "більшість". Якщо хтось скаже мені, що щось "напевно" станеться, я б подумав, що на це ідеться суб'єктивна вірогідність 60% або більше. Так само "більшість" для мене означає щось трохи більше, як 70–80%. Зрозуміло, що з наведеного вище сюжету, якщо "більшість" береться за критерій, який є більш суворим, ніж 52,5%, то ви не можете сказати, що "більшість дівчат [мають властивість, що вони] вище, ніж більшість хлопців". Цікаво, чи частиною обґрунтування питання вікторини було стимулювання перевірки слів, оскільки вони стосуються числових понять. (Якщо ви думаєте, що це все трохи нерозумно, розгляньте ці графіки, показуючи, як люди схильні тлумачити різні ймовірнісні слова та фрази.) Можливо, наміром було також підкреслити те, що в дистрибутивах у реальному світі існує велика кількість варіацій, і що єдина статистика (середня, середня, що маєш - ви) рідко будете підтримувати широкі, важкі твердження.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.