У лівих перекошених даних, який взаємозв'язок між середнім та медіанним?


12

Я думаю, що середня означає.

Це так?


2
Який відкритий курс MOOC це? Які навчальні матеріали пропонують відповісти?
Glen_b -Встановити Моніку


1
Дякую, щонайменше, такий контекст, хоча все, що залишилося, є щотижневі читання, які не кидають багато світла на це питання. Мені цікаво, що на тему мав сказати курс.
Glen_b -Встановіть Моніку

Відповіді:


16

Це нетривіальне питання (напевно, не таке тривіальне, як здається, люди, які задають питання, думають).

Труднощі в кінцевому рахунку викликані тим, що ми насправді не знаємо, що ми маємо на увазі під «косою» - багато часу це начебто очевидно, але іноді насправді це не так. Зважаючи на труднощі з уточненням того, що ми маємо на увазі під «розташуванням» та «розповсюдженням» у нетривіальних випадках (наприклад, середнє значення не завжди таке, що ми маємо на увазі, коли ми говоримо про місцезнаходження), не повинно бути несподіванкою, що більш тонкий Концепція, як косоокість, принаймні така ж слизька. Отже, це змушує нас спробувати різні алгебраїчні визначення того, що ми маємо на увазі, і вони не завжди погоджуються між собою.

1) Якщо виміряти косисть за другим коефіцієнтом нахилу Пірсона , то середнє значення ( ) буде меншим від медіани ( μ - тобто в цьому випадку ви маєте її назад).мкмк

(Популяція) другий нахил Пірсона - і буде негативним ("лівий перекіс"), коли μ < μ .

3(мк-мк)σ,
мк<мк

Зразкові версії цієї статистики працюють аналогічно.

Причина необхідного співвідношення між середнім та середнім у цьому випадку полягає в тому, що саме так визначається міра косості.

Ось щільність з нахилом зліва (як другою мірою Пірсона, так і більш частою мірою в (2) нижче):

введіть тут опис зображення

Медіана позначена в нижньому полі зеленим кольором, середнім - червоним.

Тож я очікую, що відповідь, яку вони хочуть дати вам, полягає в тому, що середня величина менша за медіану. Зазвичай це стосується тих видів розповсюджень, яким ми схильні давати імена.

(Але читайте далі, і подивіться, чому це насправді не правильно, як загальне твердження.)


2) Якщо ви вимірюєте його за звичайнішим стандартизованим третім моментом , то це часто, але далеко не завжди, випадок, що середнє значення буде менше, ніж медіана.

Тобто, можна побудувати приклади, коли вірно протилежне, або де одна міра перекосу дорівнює нулю, а інша - ненульовій.

Що вже говорити, між розташуванням середньої, медіани та спотвореності моменту немає необхідного співвідношення.

Розглянемо, наприклад, наступний зразок (той же приклад можна побудувати як дискретний розподіл ймовірностей):

  2.7 15.0 15.0 15.0 30.0 30.0

mean: 17.95
median: 15

Однак коефіцієнт нахилу (Фішера, третього моменту) коефіцієнт відхилення від'ємний (тобто за його світлами ми маємо дані з лівого нахилу), оскільки сума кубів відхилень від середньої величини від’ємна.

Тож у такому випадку лівий косий, але означає> середній.

(З іншого боку, якщо ви зміните 2.7 у наведеному вище прикладі на 3, то у вас є приклад, коли нахил моменту дорівнює нулю, але середнє значення перевищує медіану. Якщо ви складете 3,3, то момент нахилу моменту позитивний , а середнє значення перевищує медіану - тобто, нарешті, знаходиться в очікуваному напрямку.)

Якщо ви використовуєте першу косостість Пірсона замість будь-якого з перерахованих вище визначень, у вас є подібний випадок із цим випадком - напрям косості не визначає співвідношення між середнім та медіанним в цілому.


Редагувати: у відповідь на запитання в коментарях - приклад, коли середнє значення та медіана рівні, але момент нахилу - негативний. Розглянемо наступні дані (як і раніше, він також вважається прикладом для дискретної сукупності; розглянемо написання цифр на гранях штампу).

 1  5  6  6  8 10

середнє значення та медіана - це 6, але сума кубів відхилень від середньої є негативною, тому косості третього моменту є негативними.


1
@Peter Вибачте за повільну відповідь, я був зайнятий конструюванням саме таких прикладів і не бачив вашого питання.
Glen_b -Встановіть Моніку

2
Я бачив багато визначень підручників, і жоден про це не згадував. Класно.
Пітер Флом - Відновіть Моніку

6
@Peter На жаль, багато елементарних підручників просто повторюють невірну інформацію з інших підручників, не роблячи насправді ніякого реального розслідування, і таким чином розповсюджується основна помилка. Контрприклади, як бачите, побудувати порівняно просто (я просто виготовляю їх вручну в міру необхідності). Кендалл і Стюарт ( розширена теорія статистики, т. I - не дозволяйте заголовку відкладати вас, це досить читабельно), принаймні третє та четверте видання мають хорошу інформацію. Більш свіжі видання - Stuart and Ord. Я фактично неодноразово публікував цю тему в CV.
Glen_b -Встановіть Моніку

4
(5к)0,8к0,25-к(5к)0,2к0,85-к=

1
@ Nick Так, біноміали з цілим значенням - чудові приклади.
Glen_b -Встановіть Моніку

5

Ні. Дані лівого перекосу мають довгий хвіст зліва (нижній кінець), тому середнє значення, як правило, буде менше, ніж медіана. (Але дивіться відповідь @Glen_b на виняток). Не випадково, я думаю, що дані, які "виглядають" зліва перекошеними, означатимуть менше, ніж медіани.

Дані, котрі перекошені правильно, частіше; наприклад, дохід. Там середнє значення більше, ніж медіана.

R код

set.seed(123)  #set random seed
normdata <- rnorm(1000) #Normal data, skew = 0
extleft <- c(rep(-10, 5), rep(-20, 5)) #Some data to make skew left
alldata <- c(normdata,extleft)

library(moments)
skewness(alldata) #-6.77
mean(alldata) #-0.13
median(alldata) #-0.001

Чи може середнє значення колись дорівнювати медіані?
Кунян Кшетрі

unj2 Я додав приклад до своєї відповіді, коли косості третього моменту негативні, але середні = середні.
Glen_b -Встановіть Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.