Коли косою річ погана? Симетричні розподіли (як правило, але не завжди: наприклад, не для розподілу Коші) мають медіану, режим і означають дуже близькі один до одного. Отже, подумайте, якщо ми хочемо виміряти розташування популяції, корисно мати медіану, режим і значення, близькі один до одного.
Наприклад, якщо ми беремо логарифм розподілу доходу , ми зменшуємо нахил достатньо, щоб ми могли отримати корисні моделі розташування доходу. Однак у нас буде ще важчий правий хвіст, ніж ми дійсно хочемо. Щоб зменшити це далі, ми можемо використовувати дистрибутив Pareto . Розподіл Парето подібний перетворенню даних журналу журналу. Зараз і розподіл Pareto, і нормальний журнал мають труднощі з низьким рівнем шкали доходів. Наприклад, страждають обидваln0 = - ∞. Лікування цієї проблеми охоплюється силовими перетвореннями .
Приклад з 25 доходів у кілограмах доларів, покладених на веб-сайт www.
k$ lnk$
28 3.33220451
29 3.36729583
35 3.555348061
42 3.737669618
42 3.737669618
44 3.784189634
50 3.912023005
52 3.951243719
54 3.988984047
56 4.025351691
59 4.077537444
78 4.356708827
84 4.430816799
90 4.49980967
95 4.553876892
101 4.615120517
108 4.682131227
116 4.753590191
121 4.795790546
122 4.804021045
133 4.890349128
150 5.010635294
158 5.062595033
167 5.117993812
235 5.459585514
Нахил першого стовпця становить 0,99, а другого - 0,05. Перший стовпець, ймовірно, не є нормальним (Шапіро-Вілк p = 0,04), а другий істотно не є нормальним (p = 0,57).
First column Mean 90.0 (95% CI, 68.6 to 111.3) Median 84.0 (95.7% CI, 52.0 to 116.0)
Second col Exp(Mean) 76.7 (95% CI, 60.2 to 97.7) Exp(Median) 84.0 (95.7% CI, 52.0 to 116.0)
Отже, питання полягає в тому, що якщо ви випадкова людина, яка має один із перелічених доходів, що ви, швидше за все, заробляєте? Чи розумно зробити висновок, що ви заробляли б 90к або більше, ніж медіана 84к? Або більш ймовірно зробити висновок, що навіть медіана є упередженою як міра розташування і щодосвід[ середній лн( k $ ) ] 76,7 к, що менше середньої, також є більш розумним як оцінка?
Очевидно, що нормальний журнал тут є кращою моделлю, і середній логарифм дає нам кращу міру розташування. Про те, що це добре відомо, якщо не зовсім зрозуміло, проілюстровано фразою "Я передбачаю отримання 5-ти цифрної зарплати".