Я думаю, що середня означає.
Це так?
Я думаю, що середня означає.
Це так?
Відповіді:
Це нетривіальне питання (напевно, не таке тривіальне, як здається, люди, які задають питання, думають).
Труднощі в кінцевому рахунку викликані тим, що ми насправді не знаємо, що ми маємо на увазі під «косою» - багато часу це начебто очевидно, але іноді насправді це не так. Зважаючи на труднощі з уточненням того, що ми маємо на увазі під «розташуванням» та «розповсюдженням» у нетривіальних випадках (наприклад, середнє значення не завжди таке, що ми маємо на увазі, коли ми говоримо про місцезнаходження), не повинно бути несподіванкою, що більш тонкий Концепція, як косоокість, принаймні така ж слизька. Отже, це змушує нас спробувати різні алгебраїчні визначення того, що ми маємо на увазі, і вони не завжди погоджуються між собою.
1) Якщо виміряти косисть за другим коефіцієнтом нахилу Пірсона , то середнє значення ( ) буде меншим від медіани ( ∼ μ - тобто в цьому випадку ви маєте її назад).
(Популяція) другий нахил Пірсона - і буде негативним ("лівий перекіс"), коли μ < ∼ μ .
Зразкові версії цієї статистики працюють аналогічно.
Причина необхідного співвідношення між середнім та середнім у цьому випадку полягає в тому, що саме так визначається міра косості.
Ось щільність з нахилом зліва (як другою мірою Пірсона, так і більш частою мірою в (2) нижче):
Медіана позначена в нижньому полі зеленим кольором, середнім - червоним.
Тож я очікую, що відповідь, яку вони хочуть дати вам, полягає в тому, що середня величина менша за медіану. Зазвичай це стосується тих видів розповсюджень, яким ми схильні давати імена.
(Але читайте далі, і подивіться, чому це насправді не правильно, як загальне твердження.)
2) Якщо ви вимірюєте його за звичайнішим стандартизованим третім моментом , то це часто, але далеко не завжди, випадок, що середнє значення буде менше, ніж медіана.
Тобто, можна побудувати приклади, коли вірно протилежне, або де одна міра перекосу дорівнює нулю, а інша - ненульовій.
Що вже говорити, між розташуванням середньої, медіани та спотвореності моменту немає необхідного співвідношення.
Розглянемо, наприклад, наступний зразок (той же приклад можна побудувати як дискретний розподіл ймовірностей):
2.7 15.0 15.0 15.0 30.0 30.0
mean: 17.95
median: 15
Однак коефіцієнт нахилу (Фішера, третього моменту) коефіцієнт відхилення від'ємний (тобто за його світлами ми маємо дані з лівого нахилу), оскільки сума кубів відхилень від середньої величини від’ємна.
Тож у такому випадку лівий косий, але означає> середній.
(З іншого боку, якщо ви зміните 2.7 у наведеному вище прикладі на 3, то у вас є приклад, коли нахил моменту дорівнює нулю, але середнє значення перевищує медіану. Якщо ви складете 3,3, то момент нахилу моменту позитивний , а середнє значення перевищує медіану - тобто, нарешті, знаходиться в очікуваному напрямку.)
Якщо ви використовуєте першу косостість Пірсона замість будь-якого з перерахованих вище визначень, у вас є подібний випадок із цим випадком - напрям косості не визначає співвідношення між середнім та медіанним в цілому.
Редагувати: у відповідь на запитання в коментарях - приклад, коли середнє значення та медіана рівні, але момент нахилу - негативний. Розглянемо наступні дані (як і раніше, він також вважається прикладом для дискретної сукупності; розглянемо написання цифр на гранях штампу).
1 5 6 6 8 10
середнє значення та медіана - це 6, але сума кубів відхилень від середньої є негативною, тому косості третього моменту є негативними.
Ні. Дані лівого перекосу мають довгий хвіст зліва (нижній кінець), тому середнє значення, як правило, буде менше, ніж медіана. (Але дивіться відповідь @Glen_b на виняток). Не випадково, я думаю, що дані, які "виглядають" зліва перекошеними, означатимуть менше, ніж медіани.
Дані, котрі перекошені правильно, частіше; наприклад, дохід. Там середнє значення більше, ніж медіана.
R код
set.seed(123) #set random seed
normdata <- rnorm(1000) #Normal data, skew = 0
extleft <- c(rep(-10, 5), rep(-20, 5)) #Some data to make skew left
alldata <- c(normdata,extleft)
library(moments)
skewness(alldata) #-6.77
mean(alldata) #-0.13
median(alldata) #-0.001