Мабуть, найпоширеніша проблема цих типів "карт потоків" полягає в тому, що коли включено багато ліній, вони стикаються настільки сильно, що утруднює розпізнавання будь-якої не очевидної закономірності (коли вважаються зворотні потоки, що трапляються з ще більшою мірою). Також довгі лінії мають тенденцію домінувати над графікою, хоча цілком можливо, що розподіл потоків відбувається переважно на коротких просторах (наприклад, безліч різних розподілів між місцями, як правило, схожі на польоти Леві ). Я вважаю, що це не обов'язково погано (довгі рядки можуть бути цікавішими, ніж короткі рядки для багатьох явищ), але я не думаю, що ми хочемо так втратити ліс для дерев.
Хоча я не сумніваюся, що я пропустив деякі запропоновані «можливі рішення», я спробую підсумувати деякі способи, які люди намагалися вирішити проблему в роботі, яку я натрапив.
Спотворення ліній
Якщо ви ознайомитесь з деякими іншими нитками на очах, ви побачите кілька прикладів того, як люди вирішили цю проблему. Зокрема, лінії спотворені, щоб вони не перетиналися один з одним чи іншими об’єктами на карті. Whuber в відповідь на інший аналогічний питання (вже згадувалося в коментарях) є прикладом цього. Презентація деяких дослідників в Стенфорд демонструє цю ж ідею (Phan і ін., 2005). Дякуємо за те, що презентація переходить до dslamb за цю відповідь на іншій темі (і всі відповіді на цю тему також будуть цікаві для вашого запитання). Мені особливо цікаво, що одним із кардинальних прикладів цього є стара імміграційна карта Мінарда - приклад бажаного результату (близько 1864!).
Зважаючи на конкретний випадок використання (невелика кількість вузлів і ліній), це здається достатнім. Інші "рішення", які я представляю, більше призначені для візуалізації даних із багатьма лініями та багатьма джерелами-напрямками (хоча я припускаю, що вони будуть корисними підсумками для спільноти загалом, тому я продовжую незалежно).
Використання альфа-змішування, кольору та ширини / висоти ліній
Карти, які я перераховував у цій самій нитці раніше, зазначили, Представлення мережевих потоків - приклади цього. Друзі у фейсбуці - це гарний випадок коригування альфа-рівня ліній, тому потрібно набагато більше потоків, щоб представити темніший (або яскравіший у цьому випадку) зв’язок між двома місцями. Це також дефамізує більш довгі лінії, оскільки вони, як правило, трапляються рідше. Аналогічна логіка виходить із карт цінності за альфами для полігонових областей (Roth et al., 2010), про які вже згадувалося на цьому форумі .
Інша карта, яку я привожу в тій самій відповіді, використовує кольорові та нетрадиційні тривимірні тривимірні стрілові лінії (Ratti et al., 2010). Автори використовували критерії кластеризації для групування однорідних зон разом та кольорового коду (тому за визначенням області в кольорі мають більше схожих шаблонів потоку, ніж між кольорами). Критерії кластеризації самі по собі можуть бути цікавими для виявлення закономірностей у даних, хоча, мабуть, проблема в цьому, як згадував Ендрю Гелман , полягає в тому, що він говорить вам майже все, що ви вже знаєте, що ставить ближче один до одного. мають тенденцію мати більше зв’язків.
Нарешті, до цієї категорії я включаю методи, які зважують лінії (подібні до альфа-змішування), використовуючи або ширину лінії, або у випадку 3d перспективної висоти лінії, щоб передати об'єм потоку. Дивіться сторінку на сторінці програмного забезпечення для відображення потоку Tobler, щоб ознайомитись із деякими прикладами у 2d (а інша я, про яку я згадував, є прикладом у 3d із використанням висот рядків). Також на цій сторінці Tobler є дуже корисна стаття, що описує проблеми з потоковою картографією та їх історичне застосування (Tobler, 1987).
Ще один приклад в 3d - це відповідь, яку манкуф на цьому веб-сайті. Ця публікація в блозі «Соціологічні образи» показує корисний спосіб на схемі потоків для розрізнення вхідних потоків і потоків (хоча, знову ж таки, це працює, оскільки кількість вузлів і порівняно невелика, і вузли в мережі можуть бути розміщені в довільний спосіб зменшити перезволоження). Ці ж типи стрілок (і кілька інших, що використовують хешинг) також є в (Tobler, 1987).
Зрештою, хоча ширина та колір рядків насправді не вирішують проблему надмірного накреслення. Дуги в 3d допомагають дещо, хоча при більш складних моделях потоку я думаю, що вони матимуть обмежену корисність. Змішування альфа-IMO, здається, є найбільш корисним у найрізноманітніших ситуаціях із цих трьох, але колір та ширина ліній можуть / повинні використовуватися у поєднанні із спотворенням лінії, зазначеним вище.
Зменшення даних
Я групую два типи прийомів, 1) використовуючи невеликі численні карти (тобто багато карт із суттєво меншими об'єктами для візуалізації, щоб перегрузка зменшилася), або 2) інші графічні зображення, які не є лініями, але представляють деякі потоки через щільність або хороплетські карти. Приклади цього можна знайти у (Corcoran et al., 2009; Rae, 2009; Wood et al., 2010) (завдяки iant для посилання на Rae). Вони, як правило, зменшують кількість візуальної інформації, представленої або представленням серії малих численних карт (або просто меншої площі), або використовуючи схему хороплетівського відображення для представлення деякої статистики (прикладами можуть бути кількість вхідних потоків, кількість відпливів , напрям потоків, середня відстань потоків). Якщо у вас є дані про рівень точок, ви можете представити цю статистику за допомогою растрових карт щільності ядра або об'єднати їх у квадрати.
Коли інформація зменшується таким чином, перезволоження не є стільки проблемою. Дуже класний інтерактивний приклад в Інтернеті - це карта міграції журналу Forbes . Ви можете бачити лише одну округу за один раз, але зменшення інформації значно спрощує розбір ліній (і різницю між потоками та потоками). Нещодавній пост у блозі ESRI mapping також використовує аналогічну техніку з невеликими кратними (вони також вибирають певну проекцію для карти світу, щоб вона мала «гарні вигляд» лінії, і добре використовувати кольори для подальшого підкреслення різних міжнародних джерел). У цьому прикладі це спрацьовує досить добре, оскільки кінцеве призначення однакове для всіх потоків, але якщо потоки можуть бути зворотними, це, ймовірно, також не вийде.
Використання інших представлень потоків без карт
Інші на цьому веб-сайті пропонують використовувати альтернативні діаграми для фактичної карти для представлення потоків (просто відображення джерел та напрямків в інший спосіб, ніж їх фактичне географічне положення). Прикладами цього є або кутикулярні візуалізації (такі, які виробляються Circos ), дугові діаграми (див. Цей приклад на Protovis; вони також називаються крискограмами (Xiao & Chun, 2009)), або матричні теплові карти ( ось ще один приклад з Веб-сайт Protovis). Іншим варіантом було б використання певного типу автоматизованого компонування мережі для ідентифікації шаблонів у потоках (таких, як це можливо у Graphviz ). Окрім Graphviz, популярними інструментами є також Gephi, бібліотека пітонів NetworkX та деякі бібліотеки R (див.ця відповідь на сайті статистики).
Бібліотеки, які я цитую, є досить крутими, оскільки вони також розробили інтерактивні візуалізації. Ось приклад із подібним стилем до кругової графіки (хоча не кругової!). Ось ще одна інтерактивна візуалізація з використанням деяких методів спотворень ліній, обговорених раніше, розміщення мережі (схоже на кругові картограми Dorling), а також інших корисних статистичних підсумків (я бачив обидва ці приклади спочатку в блозі інформаційної естетики ).
Деякі інші ресурси, які я вважаю корисними, - це програмне забезпечення та статті, що надходять із лабораторії просторового обміну даними та візуальної аналітики . Також моделювання попиту на подорож на злочинність у програмі CrimeStat - це легке введення у застосовні методи регресії для таких даних про потоки. Будь-який з цих інструментів може допомогти вам виявити цікаві співвідношення у моделях потоку з іншою географічною інформацією. Ще одне місце, яке, можливо, отримає корисну натхнення для графічного відображення даних або статистичного аналізу, - це нещодавній випуск журналу обчислювальної та графічної статистики, том 20, випуск 2, вивчаючи статистику прибуття / вильоту рейсів для комерційних перевізників у США з 1987 по 2008 рік (якщо ви зацікавлені в обробці великих даних, це також варто вивчити). Всі статті безкоштовні, і вони мають пов’язані плакати з кожним документом.
Зрештою, дані та середовище будуть диктувати, наскільки добре деякі з цих методів працюють у зменшенні зорового скупчення, яке відбувається разом із потоками даних. Я сподіваюся, що це корисне місце, хоча знайти ідеї, як вирішити цю проблему візуалізації. Якщо ви ще більше уточните своє запитання щодо того, що ви хочете досягти, то інші можуть дати корисні відгуки про фактичні програмні реалізації (якщо щось ще не доступне).
Цитати
- Corcoran, Jonathan, Prem Chhetri & Robert Stimson. (2009) Використання кругової статистики для вивчення географії подорожі на роботу. Доповіді з регіональної науки 88 (1): 119-132.
- Фан, Доантам, Лінг Сяо, Рон Йе, Пат Ханрахан і Террі Віноград. (2005) Макет карти потоку. У візуалізації інформації, 2005. INFOVIS 2005. IEEE Symposium : 219-224. | PDF тут
- Rae, Alasdair. (2009) Від даних просторової взаємодії до інформації про просторову взаємодію? Геовізуалізація та просторові структури міграції після перепису населення Великобританії 2001 року. Комп'ютери, навколишнє середовище та міські системи 33 (3): 161-178. | PDF тут
- Ратті, Карло, Станіслав Соболевський, Франческо Калабрезе, Кліо Андріс, Джонатан Редс, Мауро Мартино, Роб Клакстон та Стівен Х. Строгац. (2010) Перемальовування карти Великобританії з Мережі взаємодій з людьми. PLOS ONE 5 (12). Стаття - це відкритий доступ за посиланням
- Roth Robert E., Andrew Wddruff & Zachary F. Johnson. (2010) Карти цінності за альфами: Альтернативна методика картограми. Картографічний журнал 47 (2): 130-140. | PDF тут
- Тоблер, Уолдо Р. (1987) Експерименти з відображення міграції за допомогою комп'ютера. Картографія та географічна інформаційна наука 14 (2): 155-163 | PDF тут
- Вуд, Джо, Джейсон Дайкс та Ейдан Слінгбі. (2010). Візуалізація джерел, напрямків та потоків за допомогою карт OD. Картографічний журнал 47 (2): 117-129. | PDF тут
- Сяо, Ніньчуань та Йонгван Чун. (2009) Візуалізація міграційних потоків за допомогою крискограм. Картографія та географічна інформаційна наука 36 (2): 183-191.
* Зауважте, посилання на необгрунтовані PDF-файли включаються, коли я можу їх знайти