Альтернатива ситам / мозаїчним ділянкам для таблиць на випадок надзвичайних ситуацій


17

Я одного разу наткнувся на тип сюжету щодо категоричних даних (тобто таблиць на випадок надзвичайних ситуацій) в Інтернеті, який мені дуже сподобався, але я його ніколи не знайшов, і навіть не знаю, як це називається. Це було по суті як ситовий сюжет, в тому, що висота рядків і ширина стовпців масштабувались відносно граничних ймовірностей. Таким чином, кожний ящик масштабувався до відносної частоти, очікуваної при незалежності. Однак вона відрізнялася від ситової ділянки тим, що замість того, щоб будувати перехресні штрихування всередині кожної коробки, вона накреслювала крапку (як у розкиданому майданчику) у місці, випадково вибраному з двовимірної форми для кожного спостереження. Таким чином, щільність точок відображає, наскільки добре спостережувані підрахунки відповідають очікуваним підрахункам. Тобто, якщо щільність була однаковою в кожному ящику, нульова модель розумна, ) може бути не дуже ймовірним за нульовою моделлю. Оскільки точки побудовані замість перехресного штрихування, між графічним елементом та спостережуваним підрахунком існує проста та інтуїтивна відповідність, що не обов'язково стосується ситових сюжетів (див. Нижче). Більше того, випадкове розміщення точок дає сюжету «органічне» відчуття. Крім того, колір може бути використаний для виділення коробок / комірок, які сильно розходяться з нульовою моделлю, а матриця сюжету може бути використана для вивчення парних зв’язків між багатьма різними змінними, тому вона може включати переваги подібних графіків. i,j

  • Хтось знає, як називається цей сюжет?
  • Чи є пакет / функція, яка легко зробить це в R або іншому програмному забезпеченні (скажімо, Mondrian)? Я не можу знайти щось подібне у vcd . Звичайно, це може бути важко закодовано з нуля, але це буде біль.

Ось простий приклад ситового сюжету, зауважте, що легко зрозуміти, як очікувані підрахунки для різних категорій повинні грати за нульовою моделлю, але важко узгодити перехресне штрихування з фактичними числами, одержавши сюжет, який не є настільки ж просто читається та естетично прикро:

    B ~B
 A 38  4
~A  3 19

введіть тут опис зображення
Для того, що варто, мозаїчний сюжет має щось протилежне: хоча легше зрозуміти, які клітини мають "занадто багато" чи "занадто мало" (відносно нульової моделі), важче розпізнати, які зв'язки між очікувані підрахунки були б. Зокрема, ширину стовпців масштабують відносно граничної ймовірності, але висоти рядків немає, що робить цю частину інформації майже неможливою.
введіть тут опис зображення
а тепер для чогось зовсім іншого ...

  • Хтось знає, звідки береться умова про використання синього для "занадто багато" та червоного для "занадто мало"? Це для мене завжди було протизаконним. Мені здається, що винятково висока щільність (або занадто багато спостережень) йде з гарячим , а низька щільність йде з холодом , і що (принаймні при сценічному освітленні) червоні гріють, а блюз - це охолодження .

Оновлення: Якщо я добре пам’ятаю, сюжет, який я бачив, містився у pdf главі (вступ чи ch1) із книги, яка була доступна у вільному доступі в Інтернеті як маркетинговий тизер. Ось приблизна версія ідеї, яку я кодував з нуля:
введіть тут опис зображення
Навіть із цією сирою версією я вважаю, що її легше читати, ніж сюжет для сита, а в чомусь простіше, ніж мозаїчний сюжет (наприклад, легше розпізнати, які стосунки між частотами клітинок опинився б під незалежністю). Було б непогано мати функцію, яка: a. зробить це автоматично з будь-якою таблицею на випадок надзвичайних ситуацій, b. може використовуватися як будівельний блок матриці сюжету, c. матиме приємні риси, які поставляються з вищезазначеними сюжетами (як, наприклад, стандартизована легенда про залишки на мозаїчній ділянці).


Отже, ви по суті хочете, щоб мозаїчний сюжет був з різним наповненням? Чи близька Rфункція assocplotдо того, що ви маєте на увазі? Якщо ні, то я думаю, що Rпрограміст може змінити це або mosaicplotзробити те, що ви хочете.
Пітер Флом - Відновіть Моніку

1
Пов’язані посилання, що цікавлять, Залишки на основі залишків для візуалізації (умовної) незалежності ( Zeileis et al. 2007 ), PDF тут , та інша нитка про візуалізацію таблиць на випадок надзвичайних ситуацій з кількома посиланнями. Я вважаю, що в статті Zeileis є хороша дискусія щодо кольору, яка може відповісти на ваше останнє запитання (можливо, було б добре ознайомитись із посиланнями, щоб побачити, чи цитують вони діаграму, про яку ви також говорите).
Енді Ш

Навпаки, @PeterFlom, я хочу, по суті, ситову ділянку з різним наповненням. Крім того, ви можете сказати, що я хочу мозаїчний сюжет, де відображувані поля зменшуються відносно очікуваних частот при незалежності (і, можливо, іншого типу заливки).
gung - Відновіть Моніку

"Хто-небудь знає, звідки береться умова про використання синього для" занадто багатьох ", а червоного для" занадто мало "? Це завжди було для мене контрсумулюючим." Гарна думка. Це дійсно контрінтуїтивно. Спектр світла проходить приблизно від синього на лівому (пов'язаний з меншою довжиною хвилі) до червоного справа (пов'язано з великими довжинами хвиль). Мозаїчні екрани, здається, перевертають це на голові ...
landroni

Ідея ситової діаграми полягає в тому, що кількість коробок у кожній комірці пропорційна спостережуваній частоті, тому відносна щільність показує більшу або меншу, ніж очікувана частота. Якщо вам не подобаються кольори, ви можете легко змінити їх за замовчуванням. Якщо вам не подобається функція затінення сита за замовчуванням, ви можете легко написати власну, наприклад,shading.points() робити те, що ви хочете, в рамках strucplot, який був цитований вище і доступний як віньєтка в vcdупаковці.
користувач101089

Відповіді:


15

Описана вами книга звучить як "Візуалізація категоричних даних", Майкл Дружні. Сюжет, описаний у 1-й главі, який, здається, відповідає вашому запиту, був описаний як тип концептуальної моделі візуалізації даних таблиці непередбачених ситуацій (вільно описується автором як динамічна модель тиску з спостережною щільністю), і його можна побачити в google preview для Ch 1. Книга орієнтована на користувачів SAS.

Доповідь на цю тему посилається тут: www.datavis.ca/papers/koln/kolnpapr.pdf

"Концептуальні моделі для візуалізації даних таблиці непередбачених ситуацій", Майкл Дружні.

http://i47.tinypic.com/148n5n7.jpg

введіть тут опис зображення

* до речі, автор також вказаний як один з авторів пакету vcd (як це було спеціально натхненно його згаданою вище книгою) - можливо, ви можете запитати його безпосередньо, чи є проста модифікація однієї з вбудованих функцій, які не легко видно.

** Схема фарбування, здається, пов'язує кольоровий синій із позитивними відхиленнями від незалежності, а червоний - негативними відхиленнями. Хоча червона схема має сенс у цьому контексті, можливо, було б доречніше використовувати зелений колір для відображення позитивних відхилень.

http://www.datavis.ca/papers/asa92.html


2
Приємна робота таємниця вирішена! Мені потрібно фактично придбати книгу, а не попередньо її переглядати в різних порядках і моїй бібліотеці раз у раз надсилати мені глави. Ця форма візуалізації IMO мені дуже нагадує те, що картографи називають «точковими картами», і звідси можна використати літературу для обгрунтування того, як крапки є кращим інструментом візуалізації, ніж лінії та штрихування штрихів. Це також хороша література з точки зору пільгових місць розташування крапок.
Енді Ш

Це дає мені гарний початок. Спасибі за вашу допомогу.
gung - Відновіть Моніку

1

Можливо, не те, що бачили, але для візуалізації вильотів очікуваних за незалежністю, графіки кореспонденції добре вмотивовані.

http://www.jstatsoft.org/v20/i03/

(Убік, книга SAS та M Friendly помилилася щодо рекомендованої корекції, і багато з сюжетів мали в них артефакти, і це, можливо, відволікло їх від сприйнятої цінності.)


Дякую за вашу допомогу, мені подобаються переписки. Чи можете ви сказати більше про цю рекомендовану коригування, яка помилилася? Яке коригування було? Як це було неточно? А що було з сюжетами?
gung - Відновіть Моніку

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.