Коли ми використовуємо бідні та медіальні, а не квантові та медіанні?


14

Я не можу знайти дефіцитні або медіальні визначення у Вікіпедії або Вольфрам Матсвіту, але наступне пояснення дано у Білкові, Д. та Мала, І. (2012), " Застосування методу L-моменту при моделюванні розподілу доходу. в Чехії », Австрійський журнал статистики , 41 (2), 125–132.

Медіальна - це значення (зразка) тканини так само, як медіана вибірки дорівнює значенню квантиля вибірки. Проби тантилів, а також квантових зразків базуються на впорядкованому зразку. Перш за все оцінюються сукупні суми спостережень в упорядкованій вибірці. Потім, для заданого процентного , , А tantile визначається як значення аналізованої змінної , яка ділить всі спостереження в впорядкованої вибірці на дві частини: сума менших або рівних спостережень від загальної суми спостережень і суми спостережень, що більше, становить залишкову цієї суми.50 % p 0 < p < 100 p % p % ( 100 - p ) %50%50%p0<p<100p%p%(100p)%

Коли має сенс використовувати їх як мірку розташування, а не більш звичайні медіани чи інші кванти? Одна можлива ситуація, доходи домогосподарств, наведена в цьому документі:

З цього визначення можна вивести, що медіа можна використовувати як розумну характеристику рівня доходу, оскільки домогосподарства з доходом, меншим або рівним медіа, отримують половину загального доходу у вибірці, а ті, у кого дохід вищий ніж медіал, що приймає іншу половину.

У цьому випадку середній дохід домогосподарств виявився 117 497 крон (тобто половина домогосподарств заробляла більше цього і половина заробляла вище) порівняно з медіальним доходом домогосподарств у розмірі 133 930 крон (домогосподарства з доходом вище цього показника отримують половину загальний дохід). Зауважте, що це порівняння не обов'язково відображає спотвореність доходів домогосподарств або навіть його нерівномірність: навіть якби доходи домогосподарств були розподілені рівномірно, медіал все одно лежатиме вище медіани. Наскільки я розумію визначення, медіал дорівнював би медіані лише тоді, коли б усі домогосподарства отримували однаковий дохід.

То чи є якась конкретна причина віддати перевагу медіалу в цьому випадку або хоча б використовувати його як додатковий захід? Що саме нам говорить порівняння між серединним та медіальним? Не видається, що медіа є безпосередньо порівнянними з іншими заходами центральної тенденції з причин, які я щойно зазначив. Чи є інші ситуації, коли медіа / тантили широко використовуються або сприймаються як особливо інформативні? Практичні приклади, де вони використовуються, із зразками дослідницьких робіт, були б дуже вітаються, а інтуїтивна ідея широкого контексту, в якій вони можуть виявитись корисними, була б ще кращою.

Це повинно вимагати, щоб підсумкові та підсумкові дані мали значення - те, що здається актуальним з грошима та як розподіляється "пиріг" - але навіть акт додавання має значення лише для певних кількостей. Для інтенсивних, а не обширних властивостей , таких як щільність або температура, будь-яке підсумовування не має фізичного значення. Мені здається, що велика властивість необхідна, але недостатня для того, щоб оснастки були корисними, оскільки я можу уявити, що аналітик з доставки цікавиться, яка вага перевезеного вантажу - це відсікання, щоб 50% всього вантажу (за вагою) було переносяться вантажами такої ваги і вище, але я не можу уявити еколога, зацікавленого в тому, яка довжина тритона така, що 50% від загальної довжини всіх тритонів вносять тритони такої довжини або більше.


3
@ NickCox Наскільки я розумію, медіана дає обмежене значення, коли грубо кажучи (я повністю ігнорую питання щодо зв'язків) половина домогосподарств отримує більше, ніж обрізана, а половина домогосподарств отримують менше, ніж це. Медіал дає різний розріз, таким чином, що загальний дохід домогосподарств, які отримують більше, ніж урізаний, становить 50% від усіх доходів, тоді як загальний дохід домогосподарств, які отримують менше, ніж відрізаний, становить 50% від усіх доходів.
Срібляста рибка

2
Підказка щодо капелюхів: мені стало цікаво цікаво від цього після коментаря @ttnphns до попереднього мого питання ; засоби (арифметичні, геометричні, гармонічні, живні, експоненціальні, комбінаторні тощо) є "аналітичними середніми". Медіана, квантили, тантили - це "позиційні середні".
Срібна рибка

4
Спасибі; Я неправильно це прочитав і ціную виправлення. Я перейду від "суми спостережень" до "суми значень", оскільки "сума спостережень" мені занадто близька до "кількості спостережень". Або, можливо, я домагаюся виправдання .... Має бути зв’язок з кривими Лоренца. Цей захід здається корисним лише в тому випадку, якщо відповідна змінна умовно є додатковою або обширною. Сер Девід Кокс часто наголошує на важливості того, чи є величини змінними великими. Таким чином, має сенс суттєво враховувати загальний дохід, загальну кількість опадів, але не загальний дохід від журналу чи загальну температуру.
Нік Кокс

2
@ NickCox Я думаю, що розтяжність - це чудовий момент (і запропоноване вами переформулювання було б також поліпшенням, на мій погляд), хоча мені здається, що велика властивість необхідна, але недостатня для того, щоб олівці були корисними. Нам здається правдоподібним, що нас може зацікавити, наприклад, яка вага перевезеного вантажу є відсічним, так що 50% всього вантажу (по вазі) перевозиться у вантажі такої ваги або вище; але я не можу уявити, що цікавить, яка довжина тритона така, що 50% від загальної довжини всіх тритонів вносять тритони такої довжини або більше.
Срібна рибка

1
Я погоджуюся на практиці, але не думаю, що принцип впливає. Відповідь "Але це не було б цікаво чи корисно" не завжди має бути деяким відображенням математичного чи статистичного принципу; також є поле для "Не роби цього!".
Нік Кокс

Відповіді:


3

p=0.5Xf(x)μ=EXμ=xf(x)dx

G(t)=txf(x)dx
tG(t)=μ/2

Чи правильне це тлумачення? Це те, що було призначено?

Якщо повернутися до первинного питання, то в контексті розподілу доходу відчутною є величина доходу така, що половина загального доходу - для людей, які перевищують цей дохід, а половина загального доходу - для людей з меншим рівнем доходу.

EDIT

G(t)

G(t)t

Інший термін, що використовується для цієї ідеї, - "часткове очікування". Дивіться, наприклад, /math/1080530/the-partial-expectation-mathbbex-xk-for-an-alpha-stable-distributed-r та використовуйте google!

X>0

Fk(x)=1EXk0xtkf(t)dt
kG(t)=μF1(t)F1FF0
{(u,L(u))}={(u,v):u=F(x),v=F1(x);x0}


1
Дякую за доповнення - мені доведеться трохи прочитати погляди!
Срібна рибка
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.