Найкращий спосіб поставити дві гістограми в одному масштабі?


14

Скажімо, у мене є два розподіли, які я хочу детально порівняти, тобто таким чином, щоб форма, масштаб і зсув були легко видимими. Один з хороших способів зробити це - побудувати гістограму для кожного розподілу, помістити їх у ту саму шкалу X і скласти одну під іншу.

Як це робити, як слід здійснювати бінінг? Чи повинні обидві гістограми використовувати однакові межі біна, навіть якщо один розподіл набагато більше диспергований, ніж інший, як на зображенні 1 нижче? Чи слід бінінг проводити незалежно для кожної гістограми перед збільшенням, як на зображенні 2 нижче? Чи є навіть хороше правило щодо цього?

Зображення 1 Зображення 2


5
Діаграми QQ набагато кращі інструменти для чіткого порівняння емпіричних розподілів. Використання їх дозволяє взагалі уникнути проблеми бінінгу.
whuber

3
@whuber: Погоджено, якщо ви просто хочете чутливої ​​візуалізації того, чи відрізняються два розподіли, але підхід гістограми є IMHO кращим, якщо ви хочете детальне ознайомлення з тим, чим вони відрізняються.
дзимча

3
@dsimcha Мій досвід був протилежним. Діаграма QQ чітко показує (в кількісному відношенні) відмінності в масштабі, розташуванні та формі, особливо в товщині хвостів. (Спробуйте порівняти два SD безпосередньо з гістограм, наприклад: неможливо, коли вони близькі за значенням. На графіку QQ вам потрібно порівняти лише нахили, що швидко і відносно точно.) Діаграма QQ поступається гістограмі за термінами вибору режимів, але жодна гістограма в цьому не підходить, поки не буде зібрано пристойний обсяг даних і не буде зроблено хороший вибір бункерів.
whuber

1
Я погоджуюсь, що сюжети QQ - найкраще рішення, хоча вони не уникають проблеми зі сміттям, вони просто змушують вас розміщувати бункери у певних місцях (квантові :-) З іншого боку, це означає, що бункери не мають насправді не слід розділяти двома дистрибутивами.
кон'югатприор

1
@dsimcha, я думаю, що щось на кшталт сюжетних вікових сюжетів може бути корисним зображенням. У будь-якому випадку для чого використовувати для цього гістограми? Просто функція розподілу сюжету безпосередньо. Однак, якщо ви граєте з емпіричними речами, то пропозиція сюжету QQ - найкращий вибір.
Дмитро Челов

Відповіді:


7

Я думаю, що вам потрібно використовувати ті ж бункери. Інакше розум грає на вас хитрощі. Нормальний (0,2) виглядає більш розсіяним відносно нормального (0,1) на зображенні №2, ніж на зображенні №1. Нічого спільного зі статистикою. Схоже, нормальний (0,1) пішов на "дієту".

-Ральф Зимовий

Кінцеві точки середньої точки та гістограми також можуть змінити сприйняття дисперсії. Зауважте, що в цьому аплеті максимальний вибір бін має на увазі діапазон> 1,5 - ~ 5, тоді як мінімальний вибір бін означає діапазон <1 -> 5,5

http://www.stat.sc.edu/~west/javahtml/Histogram.html


1
Чи можете ви надати якісь теоретичні обгрунтування цієї думки?
whuber

Ні, просто думка. Але якби я мав час, я би розпочав своє дослідження зі світу роздрібної упаковки (тонке сприйняття тіла) і включив би частину роботи Tufte.
Ральф Вінтерс

@whuber: це здебільшого пов'язане з тим, як наш мозок обробляє інформацію. Коли є менші бункери, наш розум також «стискає» межі кривої. Спробуйте перевернути розмір бункерів на рис. №2, щоб побачити, що я маю на увазі.
nico

@nico Так, в цьому питанні є перцептивний елемент. Але на першому плані стоїть питання статистики, оскільки він має набагато більший вплив: менші скриньки ==> більша мінливість вибірки у бункерах ==> більш "розірвані" гістограми ==> більша складність порівняння. Таким чином, ІМО, будь-яка гідна відповідь повинна додати підтримку статистичної теорії (як мінімум).
whuber

@whuber: Я мав на увазі той факт, що дистрибуція виглядає по- різному в двох образах. Звичайно, як вони виглядають, не має нічого спільного з тим, наскільки вони насправді розійшлися.
nico

2

Іншим підходом було б побудувати графіки різних розподілів на одному і тому ж ділянці та використовувати щось на зразок alphaпараметра ggplot2для вирішення проблем перенапруження. Корисність цього методу буде залежати від відмінностей або подібностей у вашому розповсюдженні, оскільки вони будуть побудовані з однаковими бункерами. Іншою альтернативою було б відображення згладжених кривих щільності для кожного розподілу. Ось приклад цих параметрів та інших варіантів, обговорених у потоці:

library(ggplot2)

df <- melt(
    data.frame( 
        x = rnorm(1000)
        , y = rnorm(1000, 0, 2)
    )
)


ggplot(data = df) + 
#   geom_bar(aes(x = value, fill = variable), alpha = 1/2)
#   geom_bar(aes(x = value)) + facet_grid(variable ~ .)
#   geom_density(aes(x = value, colour = variable))
#   stat_qq(aes(sample = value, colour = variable))

Чи не просто це підштовхує питання до питання вибору відповідної ширини ядра і чи можна (і як) можна порівняти два гладких, використовуючи різні ширини ядра?
whuber

1
@whuber - дійсна точка. Я не намагався запропонувати криві щільності, які використовуються методом "все кінця", просто пропонуючи інші варіанти. З цього поста видно, що в будь-якому підході є плюси і мінуси, тому пропонували це як ще одну життєздатну альтернативу кинути в мікс.
Чейз

У світлі цього я голосую вашу відповідь +1.
whuber

0

Тож мова йде про те, щоб підтримувати однаковий розмір контейнера або підтримувати однакову кількість бункерів? Я бачу аргументи для обох сторін. Обхідним питанням було б спочатку стандартизувати значення. Тоді ви могли підтримувати і те й інше.


Це спрацювало б, коли два розміри вибірки схожі. Але коли вони не відрізняються, загальний розмір відро (навіть у стандартизованих одиницях) може бути відповідним для тієї чи іншої гістограми, але не для обох. Як би ви вирішили цю справу?
whuber

Можливо, ми думаємо про різні значення стандартизації. Я мав на увазі ту, до якої я пов’язаний, якщо, наприклад, якщо одна група населення має stdev 5, а інша має stdev 10, після стандартизації вони б обоє мали stdev 1. Вони тоді могли б бути більш справедливими порівняно з однаковими розмір контейнера, оскільки кожен контейнер має порівнянну кількість пікселів та даних. Або, можливо, ви задумали про те, що "відповідний розмір сміттєвого бака" - це трохи чорне мистецтво і унікальне для кожного набору даних ...
xan

Ми поділяємо те саме значення "стандартизувати". Вибір розміру контейнера вимагає судження та знання контексту, але це розтягнення, щоб охарактеризувати його як "чорне мистецтво": див., Наприклад, stats.stackexchange.com/q/798/919 .
качан
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.