Візуалізація перетинів багатьох множин


30

Чи існує модель візуалізації, яка б добре відображала перетин перетину багатьох наборів?

Я думаю про щось на зразок діаграм Венна, але це якось може піддавати себе більшої кількості наборів, таких як 10 і більше. У Вікіпедії є кілька вищих діаграм Венна, але навіть 4-х діаграми є дуже важливими.

Думаю, що щодо кінцевого результату даних буде те, що багато наборів не будуть перетинатися, тому можливо, що діаграми Венна будуть добре - але я хотів би знайти комп’ютерний інструмент, який зможе це генерувати. Мені це здається, як діаграми Google не дозволяють отримати багато наборів.


1
Пов’язані, але для невеликої кількості наборів (для довідки): stats.stackexchange.com/questions/4211/…

Відповіді:


18

Коли у вас є велика кількість наборів, я б спробував щось більш лінійне і безпосередньо показує посилання (наприклад, мережевий графік). Flare і Protovis мають утиліти для обробки цих візуалізацій.

Дивіться це запитання для таких прикладів :

alt текст


(+1) Приємна відповідь! - Особливо мені подобається графіка. Мені було цікаво, чи є спосіб це зробити в R?
suncoolsu

1
Я не знаю жодного способу це зробити; мій пакунок webvis пропонує обгортку для Protovis, але для створення цієї графіки було б багато роботи. До речі, у цьому документі представлено "діаграму дуги", яка пов'язана: ieg.ifs.tuwien.ac.at/~aigner/teaching/ws06/infovis_ue/papers/…
Шейн

1
@suncoolsu, пакетна діаграма R може бути в змозі зробити ту саму "дугову діаграму", на яку вказував Шейн. Схоже, було б важкою роботою, хоча, щоб «сюжетна павутина» виглядала як візуальна вище. cran.r-project.org/web/packages/diagram/vignettes/diagram.pdf .
Енді Ш

та Енді. Дякую за відповіді. @Shane, я бачив ваш пакет webvis. Але мені ще потрібно це дослідити далі. Мені дуже подобаються протовісні графіки. Вони мають чудовий веб-сайт.
suncoolsu

1
Хороший графік, але він не відповідає на початкове запитання, оскільки ви не можете представити перетин 3-х чи більше наборів. Чи є такий варіант, який це робить?
nassimhddd

11

Це не буде конкурувати з відповіддю @ Shane, оскільки кругові дисплеї дійсно добре підходять для відображення складних взаємозв'язків з великомірними наборами даних.

Для діаграм Венна я використовував пакет venneuler R. Він має простий, але інтуїтивно зрозумілий інтерфейс і створює чудові діаграми з прозорістю, порівняно з базовою venn()функцією, описаною в Журналі статистичного програмного забезпечення . Однак він не обробляє більше ніж 3 категорії. Інший проект - eVenn, і він стосується множин.K=4

Зовсім недавно я натрапив на новий пакет, що стосується наборів відношень вищого порядку, і, ймовірно, дозволяють відтворити деякі діаграми Венна, показані у Вікіпедії або на цій веб-сторінці, що таке діаграма Венна? , але вона також обмежена множинами. Він називається VennDiagram, але дивіться довідковий документ: VennDiagram: пакет для генерації високонастроюваних діаграм Венна та Ейлера в R (Chen і Boutros, BMC Bioinformatics 2011, 12:35).K=4

Для подальшого ознайомлення вас може зацікавити

Kestler et al., Узагальнені діаграми Венна: новий метод візуалізації складних відносин генетичного набору , Bioinformatics, 21 (8), 1592-1595 (2004).

Діаграми Венна мають свої обмеження. У цьому відношенні мені подобається підхід Роберта Косари в « Sightings: A Venvable Challenge» або з паралельними наборами (але дивіться також цю дискусію у веб- журналі Андрія Гельмана)


Виглядає добре. я б любив це, якби він приймав не числові. Здається, потрібно перетворити свої дані спочатку в числовий список.
eastafri

Для практичних цілей було б дивовижним включити декілька екранів
user5783745

7

Ми розробили на основі матриці підхід для встановлених перехресть під назвою UpSet, ви можете перевірити це за адресою http://vcg.github.io/upset/ . Ось приклад:

Скріншот UpSet

Матриця зліва визначає перетин, який представляє рядок, останній рядок, наприклад, це перетин жанрів фільму «Дія, пригоди та діти». Стрижки праворуч показують розмір перехрестя, 4 у цьому прикладі.

Ви також можете побудувати графіки атрибутів перехресть чи інших виділень тощо. Перегляньте веб-сайт для отримання детальної інформації.

Зараз є також статична версія для R, яку ви можете знайти на згаданому вище веб-сайті, або перейшовши сюди: https://github.com/hms-dbmi/UpSetR/

Сучасний звіт про встановлену візуалізацію доступний на веб- сайті http://www.cvast.tuwien.ac.at/SetViz - більшість із них є академічними, але не мають легкодоступного коду.


1
Щодо мене, зображення, яке ви опублікували, є скоріше прикладом перезволоження, на якому надто багато інформації запаковується на одному сюжеті ...
Тім

1
@Tim. Хоча я розумію, що ви говорите, це насправді не перенапружується, оскільки всі візуальні елементи добре видно і розділені. Ви можете стверджувати, що сюжет є занадто складним, щоб легко розрізнити, але це також може бути пов'язано з тим, що ви не навчені користуватися сюжетом - не всі візуалізації можуть або повинні бути спрямовані на непідготовлених користувачів, оскільки спрощення часто призводять до обмеженого масштабу (наприклад, погана масштабованість діаграм Венна)
ThomasP85

@ ThomasP85 було багато досліджень, які показують, що люди справді погані у візуальній інтерпретації сюжетів (навіть "експертів"), включаючи навіть такі основні речі, як пиріг. У більшості випадків складна візуалізація призводить до неправильних тлумачень та непорозумінь.
Тім

@Tim Я погоджуюся, що прості завжди краще, але складні питання іноді мають складні відповіді. Причина, з якою це питання було поставлено в першу чергу, полягає в тому, що на сьогоднішній день не є переконливою, простою технікою візуалізації для роботи з великою кількістю встановлених перехресть. Прийнята відповідь стосується лише перехресть 2 ступеня, які із збільшенням кількості множин є меншою та меншою частиною загальної кількості перехресть.
ThomasP85

... а ваш приклад з пиріжковими діаграмами пов’язаний з тим, що люди (експертні чи ні) жахливі при порівнянні кутів, через що пиріжкові діаграми ніколи не слід використовувати :-)
ThomasP85
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.