Різниця - це підсумкова статистика: коефіцієнт Джині та стандартне відхилення


12

Існує кілька підсумкових статистичних даних. Якщо ви хочете описати поширення розподілу, ви можете використовувати, наприклад, стандартне відхилення або коефіцієнт Джині .

Я знаю, що стандартне відхилення базується на центральній тенденції, тобто відхиленні від середнього, а коефіцієнт Джині - загальному вимірюванні дисперсії. Я також знаю, що коефіцієнт Джіні має нижню і верхню межу [0 1], а стандартне відхилення не має . Ці властивості добре знати, але які уявлення може дати стандартне відхилення, що Джині не може і навпаки? Якщо мені довелося вибрати одне з двох, які переваги використання одного порівняно з іншими, якщо мова йде про інформативність та проникливість.


1
У вас був дивний вибір тегів. Я їх редагував.
амеба

Відповіді:


8

Дві речі для розгляду

Джині не залежить від шкали, тоді як SD є в оригінальних одиницях

Припустимо, у нас є міра, обмежена вище і знизу. SD приймає своє максимальне значення, якщо половина вимірювань проводиться на кожній межі, тоді як Джині бере максимум - один знаходиться на одній межі, а всі інші - на іншій.


Як ви думаєте, ми могли б розширити використання Джині для врахування концентрації / неоднорідності в мета-аналізі? Це може бути цікавим як засіб кількісної оцінки концентрації в неоднорідності ...
Joe_74

1
Оскільки припущення про те, що ефекти нормальні, то ні. Але я думаю, що більш повна дискусія є поза темою у цій темі
mdewey

@mdewey Останнє речення було проникливим і мені найбільше допомогло. Дякую!
Olivier_s_j

@mdewey Я тестував це сам за допомогою якогось коду, але чи є публікація, де це обговорюється? Або доказ? (Я маю на увазі останнє речення)
Olivier_s_j

@Ojtwist Стаття Wikipedia en.wikipedia.org/wiki/Gini_coefficient є корисною.
mdewey

10

Коефіцієнт Джині інваріантний до масштабу та обмежений, стандартне відхилення інваріантне до зрушення та без обмежень, тому їх важко порівняти безпосередньо. Тепер ви можете визначити інваріантну версію стандартного відхилення шляхом ділення на середнє значення (коефіцієнт варіації).

Однак індекс Джині все ще базується на значеннях, другий - на значеннях у квадраті, тому можна очікувати, що другий буде більше впливати на людей, що переживають інтенсивність (надмірно низькі або високі значення). Це можна знайти у заходах нерівності доходів , F De Maio, 2007:

Цей показник нерівності доходів обчислюється діленням стандартного відхилення розподілу доходу на його середню. Більш рівномірний розподіл доходу матиме менші стандартні відхилення; в такому випадку резюме буде меншим у більш рівноправних суспільствах. Незважаючи на те, що він є одним з найпростіших заходів нерівності, використання резюме було досить обмеженим у літературі з питань охорони здоров’я, і воно не містилося в дослідженнях гіпотези про нерівність доходів. Це можна пояснити важливими обмеженнями міри резюме: (1) він не має верхньої межі, на відміну від коефіцієнта Джині, 18 робить ускладнення тлумачення та порівняння; та (2) на два компоненти резюме (середнє та стандартне відхилення) можуть бути сильно впливають аномально низькі або високі значення доходу. Іншими словами,

1(xm)=|xnm|1/2N2(x)1(x)N2(x)

1/2

1/2

Тому, якщо ви не хочете охарактеризувати майже гауссовий розподіл, якщо ви хочете виміряти розрідженість, використовуйте індекс Джині, якщо ви хочете сприяти розрідженості серед різних моделей, ви можете спробувати таке нормове співвідношення.

Додаткова лекція: Середня різниця Джині: чудовий показник мінливості для не нормальних розподілів , Шломо Іцхакі, 2003 р., Реферат якого може представляти інтерес:

З усіх показників мінливості дисперсія на сьогоднішній день є найпопулярнішою. У цій роботі стверджується, що середня різниця Джині (GMD), альтернативний індекс мінливості, має багато властивостей з дисперсією, але може бути більш інформативною щодо властивостей розподілів, які відходять від нормальності


1

Стандартне відхилення має шкалу (скажімо, ° K, метри, мм рт.ст., ...). Зазвичай це впливає на наше судження про його масштабність. Тому ми віддаємо перевагу коефіцієнту варіації або навіть кращому (на кінцевих зразках) стандартній помилці.

[0,1]

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.