Чи є медіана тип середнього для деякого узагальнення “середнього”?


20

Поняття "середній" бродить набагато ширше, ніж традиційне середнє арифметичне; чи розтягується воно так далеко, щоб включати медіану? За аналогією,

raw dataidraw datameanraw meanid1arithmetic meanraw datarecipreciprocalsmeanmean reciprocalrecip1harmonic meanraw dataloglogsmeanmean loglog1geometric meanraw datasquaresquaresmeanmean squaresquare1root mean squareraw datarankranksmeanmean rankrank1median

Аналогія, яку я малюю, полягає в квазіарифметичному середньому , заданому:

Mf(x1,,xn)=f1(1ni=1nf(xi))

Для порівняння, коли ми говоримо, що медіана набору даних із п’яти елементів дорівнює третьому елементу, ми можемо бачити, що це рівнозначно ранжируванню даних від одного до п'яти (що ми можемо позначити функцією ); взяття середнього значення перетворених даних (що становить три); і відчитування значення елемента даних, який мав третє місце (свого роду ).ff1

У прикладах середніх геометричних значень, гармонічного середнього та RMS, була фіксованою функцією, яка може застосовуватися до будь-якого числа ізольовано. Навпаки, або присвоєння звання, або повернення з рангів до вихідних даних (інтерполяція, де це необхідно) вимагає знання всього набору даних. Більше того, у визначеннях, які я читав про квазіарифметичне середнє значення, повинно бути безперервним. Чи вважається медіана колись особливим випадком середнього квазіарифметичного значення, і якщо так, то визначається ? Або медіана коли-небудь описується як примірник якогось іншого більш широкого поняття "середній"? Квазіарифметичне середнє, безумовно, не єдине наявне узагальнення.fff

Частина питання є термінологічною (що означає "все-таки" все-таки, особливо на відміну від "центральної тенденції" чи "середньої"?). Наприклад, у літературі для нечітких систем управління функція агрегації є функцією, що збільшується з і ; функція агрегації, для якої для всіх x, y \ in [a, b] називається "середнім" (у загальний сенс). Таке визначення, зайве сказати, неймовірно широке! І в цьому контексті медіану справді називають типом середнього. ^ {[1]}F:[a,b]×[a,b][a,b]F(a,a)=aF(b,b)=bmin(x,y)F(x,y)max(x,y)[ 1 ]x,y[a,b][1]Мені цікаво, чи можуть менш широкі характеристики середнього значення поширюватися досить далеко, щоб охопити медіану - так зване узагальнене середнє (яке краще можна описати як "середнє значення") та значення Лемера - ні, але інші можуть . Чому це варте, Вікіпедія включає «медіану» у свій список «інших засобів» , але без додаткових коментарів чи цитування.

[1] : таке широке визначення середнього значення, яке належним чином розширене для більш ніж двох входів, здається стандартним у сфері нечіткого контролю та багато разів підстригається під час пошуку в Інтернеті для випадків, коли медіана описується як медіана; Я цитую, наприклад, Fodor, JC, & Rudas, IJ (2009), " Про деякі класи міграційних функцій агрегації ", IFSA / EUSFLAT Conf. (с. 653-656). До речі, у цій роботі відзначається, що одним із перших користувачів терміна "середній" ( moyenne ) був Коші в політехніці Cours d'analyse de l'École royale, 1ère partie; Проаналізуйте algébrique (1821). Пізніші внески Aczél , Chisini ,і де Фінетті в розробці більш загальних понять "середній", ніж Коші, визнані у Fodor, J., and Roubens, M. (1995), " Про осмисленість засобів ", Журнал обчислювальної та прикладної математики , 64 (1), 103-115.


Я думаю, що середня арифметична, медіана та рудна мода часто називаються загалом "середніми", а слово іноді використовується неоднозначно. Як брехати зі статистикою книга використовує це як приклад "брехні" зі статистикою. (Я розумію, що ваше питання є загальнішим, тому опублікуйте його як коментар.)
Тім

@Tim У мене є ненаукове враження, що рідко можна побачити "режим", який називають "середнім". Але, безумовно, існує величезний зв'язок плутанини навколо використання "середнього" (який іноді використовується як синонім "середнього арифметичного", а інший час включає заходи центральної тенденції, які зовсім не є засобами) та "середнього" (що в загальне використання, а не в технічному розумінні, в основному, але не виключно використовується для "середнього арифметичного"). Між іншим, це також важка тема для пошуку в Інтернеті через інші значення "середнього"!
Срібляста рибка

3
засоби (арифметичні, геометричні, гармонічні, живні, експоненціальні, комбінаторні тощо) є "аналітичними середніми". Медіана, квантили, тантили - це "позиційні середні". Ранжування сильно відрізняється від журналу, квадрата тощо, тому що це монотонне перетворення будь-якої змінної в рівномірну змінну і немає зворотного шляху до нетрансформації.
ttnphns

Btw термін "узагальнена середня" зайнятий en.wikipedia.org/wiki/Generalized_mean
ttnphns

3
Якщо ви дозволите ваги в обчисленні , то медіану можна легко розглядати як якусь середню. Аналогічно, але не однаково, поняття підстрижених засобів, безумовно, включає медіанів як обмежувальний або ввічливий особливий випадок. stata-journal.com/article.html?article=st0313 - це один досить недавній огляд. iwixi,iwi=1
Нік Кокс

Відповіді:


9

Ось один із способів, як ви можете розглянути медіану як "загальну середню різновид" - спочатку уважно визначте звичайне середнє арифметичне в статистиці порядку

x¯=iwix(i),wi=1n.

Потім замінюючи звичайну середню статистику замовлень на якусь іншу вагову функцію, ми отримуємо поняття «узагальнене середнє», яке враховує порядок.

У цьому випадку безліч потенційних заходів центру стають "узагальненими видами засобів". У випадку з медіаною для непарних , і всіх інших дорівнює 0, а для парних , .w ( n + 1 ) / 2 = 1 nnw(n+1)/2=1nwn2=wn2+1=12

Аналогічно, якщо ми подивимось на M-оцінку , оцінки розташування також можна розглядати як узагальнення середнього арифметичного (де для середнього значення квадратичне, є лінійним або вага-функція плоским), і медіана потрапляє також у цей клас узагальнень. Це дещо інше узагальнення, ніж попереднє.ψρψ

Існує безліч інших способів, як ми можемо розширити поняття "середній", що може включати медіану.


Це дуже приємно. Тісно пов’язаний з цією відповіддю, який обговорюється в статтях, цитованих у запитанні: упорядкований середньозважений показник, або OWA
Silverfish

11

Якщо ви вважаєте середнє значення як точку, що мінімізує функцію квадратичного втрати SSE, то медіана - це точка, що мінімізує функцію лінійних втрат MAD, а режим - точка, що мінімізує деяку функцію втрати 0-1. Ніяких перетворень не потрібно.

Отже, медіана є прикладом середнього фрешету .


3
@Mike Anderson: Ну, це свідчить про те, що засоби масової інформації - це середній спосіб (див. Статтю wikipedia): en.wikipedia.org/wiki/Fr%C3%A9chet_mean
kjetil b halvorsen

@Kjetil Відмінно! Те, що медіана є прикладом середнього фрешету, є точно відповіддю на моє запитання: "чи є медіана, коли-небудь описувана як примірник якогось іншого більш широкого поняття" середній "?" І +1 до Майка Андерсона. Сподіваюся, ця інформація відредагована у відповідь.
Срібна рибка

2
Я додав коментар @ Kjetil до відповіді, щоб він відображався в пошуковому веб-сайті на "Frechet mean". Дякую обом.
Срібна рибка

4

Одне легке, але плідне узагальнення - це зважені засоби , де . Очевидно, що звичайна або садова середня є найпростішим спеціальним випадком з рівними вагами .n i = 1 w i = 1 w i = 1 / ni=1nwixi/i=1nwi,i=1nwi=1wi=1/n

Дозволити ваги залежати від порядку значень величин, від найменшого до найбільшого, вказує на різні інші особливі випадки, зокрема на ідею підстриженого середнього , що відомо і іншими назвами.

Щоб уникнути надмірного вживання позначень там, де це не потрібно або особливо корисно, уявіть, наприклад, ігнорування найменших та найбільших значень та взяття (однаково зваженого) значення серед інших. Або уявіть ігнорування двох найменших та двох найбільших та прийняття середнього значення для інших; і так далі. Найбільш енергійне обрізання ігнорувало б усі, крім одного або двох середніх значень, в порядку, залежно від того, чи було число значень непарним чи парним, що, природно, є лише звичною медіаною . Ніщо в ідеї обрізки не зобов’язує вас ігнорувати однакові цифри в кожному хвості зразка, але сказати більше про асиметричне обрізання відведе нас від основної ідеї в цій нитці.

Коротше кажучи, засоби (некваліфіковані) та медіани є крайньо обмежуючими випадками сімейства (симетричних) підстрижених засобів. Загальна ідея полягає в тому, щоб дозволити компроміси між одним ідеалом використання всієї інформації в даних та іншим ідеалом захисту себе від екстремальних точок даних, які можуть бути ненадійними людьми.

Дивіться посилання тут для одного досить недавнього огляду.


4

Питання пропонує нам охарактеризувати поняття "середній" у досить широкому сенсі, щоб охопити всі звичні засоби - засоби влади, означає, медіани, обрізані засоби - але не настільки широко, що воно стає майже марним для даних аналіз. У цій відповіді обговорюються деякі аксіоматичні властивості, які має мати будь-яке досить корисне визначення поняття "середній".Lp


Основні аксіоми

Корисно широким визначенням "середнього" для аналізу даних буде будь-яка послідовність чітко визначених детермінованих функцій для і такі, щоA R n = 1 , 2 , fn:AnAARn=1,2,

(1) для всіх (середнє значення лежить між крайнощами),x = ( x 1 , x 2 , , x n ) A nmin(x)fn(x)max(x)x=(x1,x2,,xn)An

(2) є інваріантним під перестановкою своїх аргументів (засоби не дбають про порядок даних), іfn

(3) кожен зменшується в кожному з своїх аргументів (у міру збільшення чисел їх середнє значення не може зменшуватися).fn

Ми повинні дозволити бути належним набором реальних чисел (таких як усі додатні числа), оскільки безліч засобів, таких як геометричні засоби, визначені лише для таких підмножин.A

Ми також могли б цього додати

(1 ') існує принаймні деякі для яких (засоби не є крайнощами). (Ми не можемо вимагати, щоб це завжди виконувались. Наприклад, медіана дорівнює , що є мінімальним.)min ( x ) f n ( x ) max ( x ) ( 0 , 0 , , 0 , 1 ) 0xAmin(x)fn(x)max(x)(0,0,,0,1)0

Ці властивості, здається, охоплюють ідею "середнього", що є якоюсь "середньою цінністю" набору даних (не упорядкованих).

Аксіоми консистенції

Мене ще більше спокушає визначити досить менш очевидний критерій узгодженості

(4.a) Діапазон оскільки змінюється протягом інтервалу включає . Іншими словами, завжди можна залишити середнє значення незмінним, додавши відповідне значення до набору даних. У поєднанні з (3), це означає, що приєднання крайніх значень до набору даних потягне за собою середнє значення до цих крайнощів.t [ хв ( х ) , макс ( х ) ] f n ( x ) tfn+1(t,x1,x2,,xn)t[min(x),max(x)]fn(x)t

Якщо ми хочемо застосувати поняття середнього значення до розподілу або "нескінченної сукупності", то одним із способів було б його отримання в межах довільно великих випадкових вибірок. Звичайно, обмеження може не завжди існувати (воно не існує для середньої арифметичної, коли розподіл не очікує, наприклад). Тому я не хочу вводити будь-які додаткові аксіоми, щоб гарантувати існування таких меж, але наступне видається природним і корисним:

(4.b) Щоразу, коли обмежений і - послідовність зразків з розподілу підтримуваного на , тоді межа майже напевно існує. Це запобігає тому, щоб середнє значення назавжди «підстрибувало» в межах навіть якщо розміри зразків стають все більшими та більшими.x n F A f n ( x n ) AAxnFAfn(xn)A

У той же самий напрямок ми могли б ще більше звузити думку про те, щоб наполягати на тому, щоб вона стала кращою оцінкою "місця розташування" у міру збільшення розмірів вибірки:

(4.c) Щоразу, коли обмежений, то дисперсія розподілу вибірки для випадкового вибірки з не зменшується в .Afn(X(n))X(n)=(X1,X2,,Xn)Fn

Аксіома неперервності

Ми можемо розглянути питання про те, щоб попросити засоби "добре" змінити дані:

(5) є окремо безперервним у кожному аргументі (невелика зміна значень даних не повинна викликати раптового стрибка середнього значення).fn

Ця вимога може усунути деякі дивні узагальнення, але вона не виключає жодного відомого значення. Це виключить деякі функції агрегації.

Аксіома інваріантності

Ми можемо уявити засоби, що застосовують до даних про інтервали або відношення (у загальновідомому сенсі Стівенса). Ми не можемо вимагати, щоб вони були інваріантними при зміщенні місця (геометричне середнє значення немає), але ми можемо вимагати

(6) для всіх і всіх для яких . Це говорить лише про те, що ми можемо обчислити використовуючи будь-які одиниці вимірювання, які ми любимо.fn(λx)=λfn(x)xAnλ>0λxAnfn

Усі засоби, згадані у питанні, задовольняють цю аксіому, за винятком деяких функцій агрегації.


Обговорення

Загальні функції агрегації , як описано в запитанні, не обов'язково задовольняють аксіоми (1 '), (2), (3), (5) або (6). Чи задовольняють вони якісь аксіоми консистенції, може залежати від того, як вони поширюються на .f2n>2

Звичайна серединна проба має всі ці аксіоматичні властивості.

Ми могли б збільшити аксіоми послідовності, які слід включити

(4.d) для всіхf2n(x;x)=fn(x)xAn.

Це означає, що коли всі елементи набору даних повторюються однаково часто, середнє значення не змінюється. Це може бути занадто сильним: середнє значення Winsorized не має цієї властивості (крім асимптотики). Метою Winsorizing на рівні є опір проти змін принаймні даних в будь-якій крайності. Наприклад, середнє середнє значення арифметики - - середнє арифметичне , що дорівнює , але середнє значення 10-ти вимкнено - .100α% 100α%(1,2,3,6)(2,2,3,3)2.5(1,1,2,2,3,3,6,6)3.5

Я не знаю, яка з аксіом консистенції (4.a), (4.b) або (4.c) була б найбільш бажаною чи корисною. Вони здаються незалежними: я не думаю, що жодне з них означає третє.


(+1) Я думаю (1 '), "засоби не є крайнощами", це цікавий момент. Багато інакше природні визначення середнього траплятися включати мінімум і максимум в якості спеціальних або граничних випадків: це вірно енергетичних засобів , Лемера коштів , Фреш середнього , Кізіньте середнє і Stolarsky середнього . Хоча це здається трохи дивним називати їх "середніми"!
Срібляста рибка

Так, обмеження випадків неминуче. Але для кінцевих наборів даних ми можемо хотіти наполягати, що ні max, ні min не кваліфікуються як "засоби".
whuber

З іншого боку, не тільки правда, що "звичайна медіана вибірки користується всіма цими аксіоматичними властивостями", але і звичайна квантиль вибірки (якщо я щось не пропустила). Це також дивно позначати, наприклад, верхній квартал як "середній" (хоча я бачив, що він використовується як міра центральної тенденції щодо дуже перекошених даних). Якщо ми приймаємо всі інші кванти, то більше не відчуваємо себе настільки збоченими, щоб визнати мінімуми та максимуми. Але я, безумовно, бачу, що може бути бажаним хоча б зберегти за собою право їх виключення.
Срібна рибка

1
Мене не турбує прийом квантилів в пантеон засобів. Зрештою, для заданих сімей розподілів певні немедіанні кванти збігатимуться з арифметичними засобами, тож ви можете виникнути у біді, якщо спробуєте усунути цю можливість аксіоматично. (Розглянемо, наприклад, сімейство лонормальних розподілів постійних геометричних SD.) Якщо середнє арифметичне не може кваліфікуватися як середнє, все втрачається!
whuber

1
Я розглянув цей підхід і відхилив його, як пояснено у моїй відповіді: якщо ви застосовуєте такий критерій для , ви усунете медіану як форму середнього! n>2
whuber

2

Я думаю, що медіану можна вважати типом узагальнення середнього арифметичного. Зокрема, середнє арифметичне та медіана (серед інших) можуть бути уніфіковані як особливі випадки середнього чисіні. Якщо ви збираєтесь виконати деяку операцію над набором значень, середнє значення Chisini - це число, яке ви можете замінити всі вихідні значення в наборі і все одно отримати однаковий результат. Наприклад, якщо ви хочете підсумувати свої значення, заміна всіх значень середнім арифметичним дасть ту саму суму. Ідея полягає в тому, що певне значення є репрезентативним числом у множині в контексті певної операції над цими числами. (Цікавим наслідком такого способу мислення є те, що задане значення - середнє арифметичне - може вважатися репрезентативним лише за умови, що ти робиш певні речі з цими числами.)

Це менш очевидно для медіани (і зауважу, що медіана не зазначається як один із засобів Кисіні у Вольфрамі чи Вікіпедії ), але якби ви дозволяли проводити операції над рангами, медіана могла б вписатись у ту саму ідею.


Це дуже цікава пропозиція. Чи можете ви запропонувати відповідну операцію, щоб для медіани було б ? е ( М , М , . . . , М ) = е ( х 1 , х 2 , . . . , Х п )Mf(M,M,...,M)=f(x1,x2,...,xn)
Срібна рибка

Це гарне запитання, @Silverfish, я думав про це ;-). Моє думка більше, що у вашому питанні та обговоренні коментарів концептуальна основа, як видається, як отримати середнє значення & як повернути дані від середнього; ОТОХ, моє обрамлення - це те, що ми використовуємо для: а саме як стислого представлення даних без мінімальних втрат інформації.
gung - Відновіть Моніку

До питання я додав кілька цитат, які показують більш широке коло концептуальних рамок, включаючи цю. На даний момент я не бачу кращого ніж "взяти медіану", що не зовсім здається в дусі твору! f
Срібна рибка

@Silverfish, я вважаю, це здається дещо проблематичною діркою в моєму становищі.
gung - Відновіть Моніку

Хоча розуміння настанови Кісіні полягає в тому, що, наприклад, середнє арифметичне зберігає суму, тоді як геометричне середнє зберігає добуток, все ж вірно (просто менш цікаво), що середнє арифметичне також тощо. Тож я не переконаний, що це фатальний удар. ˉ х(x¯,x¯,...,x¯)x¯
Срібна рибка

-1

Питання недостатньо чітко визначене. Якщо ми погоджуємось із загальним "вуличним" визначенням середнього значення як суми n чисел, поділених на n, то у нас є частки землі. Далі Якщо ми подивимось на заходи центральної тенденції, можна сказати, що середня та середня - це генереалізація, але не одна від одної. Частина мого фону є не параметричними, тому мені подобається медіана та надійність, яку вона надає, інваріантність монотонної трансформації тощо. але кожен захід має своє місце залежно від об'єктивної.


2
Ласкаво просимо на наш сайт, Боб. Я вважаю, що якщо ви прочитаєте до кінця питання - особливо довгий передостанній абзац - ви виявите, що він є чітким і чітко визначеним. (Якщо ні, то було б непогано пояснити, що ви маєте на увазі під «не чітко визначеним.) Ваші коментарі насправді не стосуються того, про що ви
питаєте

1
Я насправді співчуваю почуттю Боба, що питання не є дуже чітко визначеним, в тому сенсі, що поняття "середній" не має єдиного визначення, але я постарався зробити все можливим, щоб все було максимально зрозумілим. Я сподіваюся, що моя остання редакція допомагає з’ясувати речі.
Срібна рибка

1
Причина, по якій я вважаю, що питання має якусь цінність, крім простої термінології (що все-таки означає, і чи є визначення, яке ми можемо розтягнути на медіану?), Це те, що може бути повчальним бачити медіану як лише одну член родини узагальнень середнього; Приклад Ніка Кокса як медіана як обмежувальний випадок підстриженого середнього є особливо приємним - він чітко поєднується з властивістю "міцності", яка вам подобається. У сімействі підстрижених засобів середнє арифметичне «вуличне» і медіана лежать на протилежних кінцях із спектром між ними.
Срібна рибка
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.