Просте пояснення для паралельних ділянок координат


13

Я прочитав і побачив багато сюжетів паралельних координат. Може хтось відповість на такий набір питань:

  1. Що таке паралельні графіки координат (PCP) простими словами, щоб мирянин міг зрозуміти?
  2. Математичне пояснення з якоюсь інтуїцією, якщо це можливо
  3. Коли PCP корисні і коли їх використовувати?
  4. Коли PCP не корисні і коли їх слід уникати?
  5. Можливі переваги та недоліки PCP

Чудова тема - Ви отримаєте багато +1 для цього питання ...
Тал Галілі

1
@Tal .. дякую :-) Але я хотів дізнатися більше і, можливо, розширити статтю Wiki, яка не надто інформативна.
suncoolsu

Великий стимул :)
Тал Галілі

Відповіді:


6

Мені здається, що основна функція PCP полягає у виділенні однорідних груп індивідів, або навпаки (у подвійному просторі, за аналогією з PCA) специфічні структури асоціації на різних змінних. Він створює ефективний графічний підсумок багатоваріантного набору даних, коли немає занадто багато змінних. Змінні автоматично масштабуються до фіксованого діапазону (як правило, 0–1), що еквівалентно роботі зі стандартизованими змінними (для запобігання впливу однієї змінної на інші через проблему масштабування), але для дуже великого набору даних (# змінних> 10), ви, безумовно, повинні дивитись на інші дисплеї, наприклад, графік коливання або теплова карта , що використовується в дослідженнях мікромасив.

Це допомагає відповідати на такі питання:

  • чи є узгоджена модель індивідуальних балів, яка може бути пояснена конкретною приналежністю до класу (наприклад, різниця за статтю)?
  • чи є систематична коваріація між балами, що спостерігаються за двома або більше змінними (наприклад, низькі бали, що спостерігаються на змінній , завжди пов'язані з високими показниками на )?X1X2

На наступному сюжеті даних райдужної оболонки чітко видно, що види (тут показані різними кольорами) демонструють дуже дискримінантні профілі, якщо враховувати довжину та ширину пелюсток, або що Ірис сетоза (синій) є більш однорідною щодо їх довжини пелюсток ( тобто їх дисперсія нижча), наприклад.

alt текст

Ви навіть можете використовувати його як допоміжний метод для класифікації або зменшення розмірів, наприклад, PCA. Найчастіше під час виконання PCA, крім зменшення простору функцій, ви також хочете виділити кластери осіб (наприклад, є люди, які систематично набирають вищі результати за деякою комбінацією змінних); це зазвичай зменшується, застосовуючи якусь ієрархічну кластеризацію за факторними оцінками та підкреслюючи отримане членство кластера на факторному просторі (див. пакет FactoClass R).

Він також використовується в кластерних схемах ( Візуалізація неієрархічного та ієрархічного аналізів кластерів ), який спрямований на вивчення того, як розвивається розподіл кластерів при збільшенні кількості кластерів (див. Також, Які зупиночні критерії для агломеративної ієрархічної кластеризації застосовуються на практиці? ).

Такі дисплеї також корисні, коли вони пов'язані зі звичайними розсіювачами (які за конструкцією обмежуються двовимірними зв'язками), це називається чищенням і воно доступне в системі візуалізації даних GGobi або в програмному забезпеченні Mondrian .


4

Щодо питань 3, 4 і 5, я б запропонував вам ознайомитись із цією роботою

Сприймання шаблонів у паралельних координатах: визначення порогових значень для ідентифікації стосунків: Джиммі Йоханссон, Камілла Форсел, Матс Лінд, Метью Купер в інформаційній візуалізації, Vol. 7, № 2. (2008), стор 152-162.

Підводячи підсумок своїх висновків, люди в порядку визначають напрямок нахилу взаємозв'язку між кожним вузлом, але вони не так добре визначають силу зв'язку або ступінь схилу. Вони дають запропоновані рівні шуму, за яких люди все ще можуть розшифрувати стосунки у статті. На жаль, стаття не обговорює визначення підгруп за кольором, як демонструє chl.


4

Завітайте на сторінку http://www.cs.tau.ac.il/~aiisreal/, а також подивіться нову книгу

Паралельні координати - Ця книга про візуалізацію, систематичне включення фантастичного розпізнавання образів людини в процес вирішення проблем ... www.springer.com/math/cse/book/978-0-387-21507-5.

В гл. 10 є безліч реальних прикладів з багатовимірними даними, що показують, як можна використовувати паралельні координати (абр. || -cs). Також варто навчитися деякій математиці для візуалізації та роботи з багатовимірними / багатовимірними відносинами (поверхнями), а не лише наборами точок. Це цікаво бачити та працювати з аналогами знайомих предметів у багатьох вимірах, тобто смуга Мебіуса, опуклі набори тощо.

Якщо коротко, || -cs - багатовимірна система координат, де осі паралельні одна одній, що дозволяє бачити багато осей. Методика застосована до алгоритмів вирішення конфліктів в управлінні повітряним рухом, комп'ютерному баченні, керуванні процесами та підтримці рішень.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.