Які існують популярні варіанти візуалізації 4-мірних даних?


12

Скажімо, у мене є наступні чотири розмірні дані, де перші три можна вважати координатами, а останню можна вважати значеннями.

c1, c2, c3, value
1, 2, 6, 0.456
34, 34, 12 0.27
12, 1, 66 0.95

Як краще візуалізувати вплив перших трьох координат на останнє значення?

Я знаю три методи.

Один - 3D-графік для перших трьох координат, розмір точок як чотири значення. Але не так просто побачити тенденцію в даних.

Іншим є використання серії 3D-сюжетів, кожен з яких зафіксований координатою. введіть тут опис зображення

Ще одним може бути так званий «графік шпаклювання» в решітці Р. Не сюрприз, якщо це для цієї мети, але, здається, так. введіть тут опис зображення


2
Вам потрібен статичний дисплей (наприклад, для паперу)?
gung - Відновити Моніку

Відповіді:


12

Якщо перші три - просто просторові координати, а дані рідкі, ви можете просто зробити 3D-графік розсіяння з різними розмірами або кольоровими точками для значення.

Виглядає приблизно так: (джерело: gatech.edu )Розсип

Якщо ваші дані призначені для суцільного характеру та існують на ґратчастій сітці, ви можете побудувати декілька ізоконтурів даних за допомогою маршових кубів .

Ще один підхід, коли у вас щільні 4D дані, - це відображення декількох 2D "фрагментів" даних, вбудованих у 3D. Це буде виглядати приблизно так:

Фрагменти


Кольоровий 3D-розсіювач дійсно підходить лише для безперервних функцій на даних 3D. Якщо градієнт функції плавно змінюється, то ви можете побачити деякий візерунок по точковому розсіюванню. Так само візуалізація гучності внизу найкраще працює і в цьому сценарії. Якщо функція дуже галаслива, вам буде важко щось побачити. Якщо у вас є 4 пояснювальні змінні (наприклад, для PCA або кластеризації), графік 3 в евклідових координатах і четвертий, використовуючи деяке нелінійне відображення для кольорів, вводячи деякий перцептивний зміщення, який неможливо оцінити кількісно.
Діанна Кук

@DianneCook це правда. Я думаю, це те, що я отримую за те, що завжди працюю з гладкими, безперервними тривимірними об'ємними даними;)
mklingen

Гей, ось що запитав запитальник% ^)
Діанна Кук

9

Чи є у вас чотири кількісні змінні? Якщо так, спробуйте екскурсії, паралельні графіки координат, матриці розсипання. Пакет tourr (і tourrGui) в R буде проводити тури, в основному обертання у великих розмірах, ви можете вибрати проект на 1D, 2D або більше, і є JSS-папір, який ви можете прочитати, щоб почати цитувати його. Паралельні графіки координат та матриці розсіювання є в пакеті GGally, також матриці розсіювання є в пакеті YaleToolkit. Ви також можете подивитися на http://www.ggobi.org для отримання відеороликів та додаткової документації щодо всіх цих питань.

Якщо ваші дані повністю категоричні, вам слід використовувати мозаїчні сюжети чи варіанти. Погляньте на пакунок productplots в R, також vcd має деякі розумні функції, або ggparallel пакет зробити еквівалент паралельних ділянок координат для категоричних даних. Також щойно знайдений пакунок extracat має деякі функції для відображення категоричних даних.

Спочатку я неправильно прочитав це питання, тому що зупинився на питанні і нехтував прочитати повний опис. Як і в нижченаведеному підході (кольорові точки в 3D), ви можете використовувати пов'язані кисті для дослідження функцій, визначених на просторах великих розмірів. Подивіться на відео тут , який показує робимо це для 3D багатовимірної нормальної функції. Кисть малює точки з високою щільністю (високі значення функцій), а потім переходить на нижчі та нижчі значення щільності (низькі значення функцій). Місця, в яких відбирається функція вибірки, відображаються в тривимірному обертовому розсіювальному пристрої, використовуючи тур, який також може бути використаний для перегляду 4, 5 або вищих розмірних доменів.


2

Спробуйте обличчя Черноффа . Ідея полягає в приєднанні змінних до рис обличчя. Наприклад, розмір посмішки буде однією змінною, округлість обличчя - іншою і т. Д. Як би смішно це не звучало, це насправді може спрацювати, якщо ви знайдете розумний спосіб відображення змінних у функції.

Інший спосіб - показати 2-д проекції 3-денної фазової діаграми. Скажімо, у вас змінні x1, x2, x3, x4. Для кожного значення x4 намалюйте 3-d графік (x1, x2, x3) точок та з'єднайте точки. Це найкраще працює, коли замовлено x4, наприклад, дата чи час.

ОНОВЛЕННЯ. Ви також можете спробувати графіки з бульбашками. Три розміри мали б звичайну декартову форму x, y, z і 4-й розмір - розмір точки міхура.

Ви можете спробувати анімацію, тобто використовувати час як четвертий вимір.

Також поєднання міхура та анімації: x, y, міхур та час.

Також, пов'язане з Черноффом, - це графічний сюжет , який може виглядати трохи серйозніше. Це зірки, довжина променів пропорційна змінним значенням.


Дякую за відповідь. Здається, другий варіант можливий для моєї проблеми. Я думаю, що перший видається не таким серйозним для дослідження. В основному я хотів би, щоб сюжет може виявити певну тенденцію чи вплив трьох факторів на значення (четвертий вимір).
Тайлер 傲 来 国 主

5
Особи Чернова використовували в серйозних дослідженнях, афаїк.
Аксакал

1
Грані Чорноффа можуть бути надзвичайно корисними, особливо коли розмірність становить приблизно 10-20 змінних. Для чотирьох вимірів вони не такі ефективні, як інші види графічних зображень.
whuber

3
обличчя чернофф - жахлива ідея! якщо вам доведеться використовувати сюжет іконок, використовуйте зірку. Якщо у вас дійсно невеликий набір даних, це може бути корисним, але спробуйте скласти 1000 іконок і побачити, чи справді ви можете щось побачити!
Діанна Кук
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.