Ефективне відображення демографічних даних на друкованій карті


29

Я хотів би побудувати наступні дані для кожної зони (всього 30 зон) на друкованій / неінтерактивній карті:

  • Середній вік
  • Середній дохід домогосподарств
  • Кількість домогосподарств
  • Густота населення
  • Кількість людей
  • Кількість робітників

Як би ви ефективно відображали вищевказані 6 шарів на одній карті?


1
Наскільки великі зони відносно розміру сторінки? Чи можете ви помістити невеликий сюжет у кожній зоні? (наприклад, радіолокаційна карта)
djq

@celenius - Це типовий тип опитування перепису населення, де зони міста значно менші, ніж житлові зони, які значно менші, ніж приміські / сільські зони
Дассукі

1
Ці 6 шарів на статичній карті - це важка робота з дизайну. Яке питання перешкоджає використанню інтерактивної карти?
Тревезі

@Trevesy - здебільшого вимога полягає у створенні друкованої карти, яка висвітлює 6 змінних для сприяння візуальному аналізу
dassouki

1
Я взяв на себе сміливість додати тег візуалізації, сміливо видаляйте його, якщо вважаєте, що це недоречно.
Andy W

Відповіді:


20

Я б сказав, що ви не можете включати всі ці дані на одну карту, і це має сенс. Я рекомендую вам подумати за принципом Туфте про малі кратні, що мають кілька менших карт однієї області, кожна з яких використовує різну змінну. Приклад: http://www.juiceanalytics.com/writing/better-know-visualization-small-multiples/

Вже тоді у вас є проблема, що ви використовуєте купу різних одиниць, тому вам потрібна купа ключів. Іншим способом перегляду даних (але не на карті) є використання таблиці з усіма значеннями, кольоровими (тобто - різними кольорами для нижче середнього, середнього, вище середнього)

Також рекомендую ознайомитись з атласом перепису для отримання додаткових ідей на карті: http://www.census.gov/population/www/cen2000/censusatlas/

Може допомогти детальніше замислитись над тим, яке саме повідомлення ви намагаєтесь надати (не лише про те, які дані у вас є).


5
+1 Це набагато краще, ніж заплутати, намагаючись символізувати одразу шість змінних. Крім того, чому б не надрукувати таблицю даних? Шість стовпців + ідентифікатор, 30 рядків: він достатньо малий і дає всі деталі, кому хто знадобиться.
whuber

13

Неможливо ефективно показати так багато даних на одній карті. Дві можливості:

  • Створіть 6 карт,

  • Проаналізуйте свої дані, щоб класифікувати ваші регіони та відобразити результат класифікації. Аналіз основних компонентів може допомогти визначити найважливіші кореляції у вашій змінній. Цей метод був використаний для створення цієї синтетичної карти:

alt текст

з цих:

alt текст alt текст


Проблема наявності 6 карт полягає в тому, що важко візуально визначити будь-які тенденції. Іноді приємно подивитися на карту з декількома змінними і побачити, як все
вирівнюється

2
@dassouki, щоб побачити, як вибудовуються речі, вам не обов’язково їх збирати. Двовариантні розсіювачі відповідали б цим критеріям, і їх було б набагато простіше інтерпретувати.
Енді Ш

3
Перевага наявності 6 карт є те , що це легко візуально визначити тенденції! Якщо ви намагаєтеся об'єднати шість (або більше) змінних в одну карту, то складно знайти шаблони. (Якби ця карта включала тисячі функцій, я б змінив це зауваження: певні види відображення, такі як візуалізація гліфів , можуть бути надзвичайно ефективними для пошуку шаблонів у багатовимірних наборах даних: lmi.bwh.harvard.edu/papers/papers/ KindlmannTVCG2006.html )
whuber

@julien, Класні речі, вас може зацікавити ця стаття, яку я щойно натрапив, e-publications.org/ims/submission/index.php/AOAS/user/… , у ній є карти з пов'язаним PCA-аналізом аналогічних багатовимінних. дані, а також код R для створення сюжетів.
Енді Ш

Дійсно цікаво, мені доведеться прочитати про це.
neuhausr

9

Я погоджуюся, що малі множини - це, мабуть, хороший спосіб підійти до цієї проблеми. Щоб доповнити карту, я б також запропонував матрицю розсипу ваших змінних, яка б ідентифікувала двофазні кореляції. Поки ви втрачаєте географічний аспект своїх даних, набагато простіше візуалізувати зв’язки між змінними в розсіювальному апараті, ніж порівняти дві карти (навіть поряд з ними).

Якщо ви все ще хочете зафіксувати якісь просторові тенденції, ви можете включити просторову статистику (наприклад, локальний Іран Морана) між розподілами та / або вихідними змінними.

Редагувати: Нещодавно я наткнувся на деяку роботу з переглядом Моральної статистики, опублікованої Андре-Мішелем Геррі (спочатку в 1883 р.), Метою якої є візуалізація багатоваріантних відносин у просторі. Реалізація цих авторів дуже схожа на те, що було запропоновано в цій темі, невеликі множини, аналіз основних компонентів, матриць розсіювання сюжетів та в межах багатокутних діаграм. Додаємо кілька фотографій від А.-М. Моральна статистика Геррі Франції: виклики для багатовимірного просторового аналізу за: Майкл Дружні статистичні науки, Вип. 22, № 3. (серпень 2007 р.), С. 368-399 ( PDF безкоштовно). Також інша стаття ( Dray and Jombart, 2010 ) аналізує ті самі дані та має деякий вихідний код у R для створення зазначених сюжетів.

Одне зображення є матрицею розсіювання, інше - це те, що називається зірковою діаграмою (це просто інший спосіб представлення смужкових діаграм, як запропонував Пабло). alt текст alt текст


8

Ось чудовий приклад невеликих множин, розміщених у статті Ендрю Гельмана (та блогу компанії) Статистичне моделювання, причинно-наслідкові умови та соціальні науки . На карті передбачена підтримка виборцями шкільних ваучерів за державою, що залежить від доходу та різних категорій раси та релігій. Білим неєвангелістам дуже не подобаються шкільні ваучери! (Якщо ви переходите до власного блогу, хоча він відображається в даних опитування 2004 року, їхня підтримка шкільних ваучерів серед цієї групи). введіть тут опис зображення


Графік крутий, але кольорова шкала жахлива. Чому 50% надають пріоритет, роблячи його сірим? Звичайно, він повинен просто використовувати кольори теплової карти, чи щось? Крім того, чому лише релігійні люди розділяються на релігію? напевно, було б більше сенсу розділятись за расою, а потім за релігією?
naught101

@ naught101, мене трохи бентежить твій негатив. Безумовно, сірий знебарвлюється порівняно з яскравішими або темнішими кольорами на будь-якому кінці спектру. У той час як я абівалентний щодо довільно розходяться на 45%, ІМО при складанні невеликих декількох карт на зразок цих доброякісних має дуже контрастні значення. Коментар щодо релігії / розбиття раси не має особливого сенсу ні ІМО. Це категорії, які, очевидно, дуже пов'язані з тим, чи підтримує окремий ваучер, і, здається, деякі підмножини, які ви пропонуєте, не існують. продовження ...
Andy W

IE Я дуже сумніваюся, що в опитуванні існує достатня кількість "чорних католиків", щоб сказати щось істотне про таку групу (ні "латиноамериканські протестанти, не євангельські"). Я б запропонував вам прочитати публікацію Гельмана і, сподіваюся, це зрозуміє мотивацію підгрупи.
Енді Ш

можливо, саме такий сірий стирчить на моєму екрані. Я думаю, що краще було б виділити це білим, а може, сірим фоном. Також варто відзначити, що два зображення в блозі Гельмана мають різні масштаби ... Я був під враженням, що населення чорного населення значно вище, але я просто подивився на дані перепису, і становище виправлено. Одним дивним є те, що перепис визначає латиноамериканське походження як ортогональне для гонки (це окреме питання). Я здогадуюсь, відмінності Гельмана визначаються по-різному ..
naught101

@ naught101 це не інформація з перепису, це з іншого опитування (перепис не має нічого громадської думки щодо цього)
Andy W

5

Щоб вибрати між представленими тут рішеннями, ви можете надати дві ключові відомості:

  • яке призначення карти? (Відкрити, викрити?)
  • що призначена для публіки карта? (Ви, колеги-аналітики, містобудівник, громадськість?)

Пропоновані тут рішення можуть мати різну ефективність залежно від призначення та загальнодоступності.

Я хотів би узагальнити відповідь Жюльєна (одна синтетична карта за допомогою PCA), цитуючи техніку діагоналізації матриці, описану Дж. Бертіном. Його корисно, коли потрібно шукати синтез всієї інформації, а не повне представлення даних.

Коротше кажучи, вона полягає у поданні кожної змінної з гістограмою, сортування стека гістограм таким чином, щоб значення (зони карти) вирівнювались по діагоналі, щоб отримати типологію:

alt текст

(Джерело: http://books.google.com/books?id=2tlQAAAAMAAJ&dq=bertin%20graphique%20information&hl=fr&source=gbs_s similarbooks )


4

Це багато інформації, і це факт, що одна карта, що поєднує їх усіх тематично, призведе до марної презентації через зорове забруднення. З іншого боку, існує 30 зон, тож багато карт для кожної зони також призведуть до забруднення.

Моє рішення: Виберіть, яка з них є найважливішою інформацією, скажімо, «дохід домогосподарств», а потім зону карти на деякі категорії доходів. І, нарешті, для кожного місця доходу побудуйте бал-чат з іншими 5 атрибутами.

З цією картою можна зробити порівняння на зразок, наприклад: "Області з високим рівнем доходу завжди показують велику кількість працівників і середній вік понад 21 рік".

Подивіться на приклад ...

alt текст


4

Можливо, деякі з цих ідей можуть допомогти?

Якщо у вас є шість вимірів:

1: Хороплет : приклад доходів домогосподарств 0

2, 3 та 4: Символи : Представлення кількості людей у ​​вигляді крапок, що дозволяє вам бачити тло: приклад 1, приклад 2 із застосуванням градацій сірого для працівників / непрацівників та іншої кольорової гами для відображення віку

5: 3D : Використання щільності населення як місцевості, приклад 3

6: (Я не можу придумати шостий спосіб!)

Чи не є надмірним показ "Кількість домогосподарств", "Густота населення" та "Кількість людей"?

Я був би скептично настроєний, якби карта з такою складністю була зрозумілою для кожного, окрім вас. Якби я його презентував, я б спочатку показав кожен елемент окремо, а потім додав би його, щоб аудиторія змогла зрозуміти кроки.


Одним із альтернативних способів (якщо у вас немає місця для радіолокаційного графіка для кожної зони, можна створити "гліф", який представляє цю інформацію, приклад 4, рис. 10.28 . Я думаю, що це, як правило, важко зрозуміти, і їх непросто спроектувати. Очевидно, але пов'язаний приклад може бути використаний у цьому випадку.


Ще одна думка, яку я мав, - екструдувати багатокутники на однакову висоту для кожного багатокутника, а потім використовувати ділянку висоти для представлення цих параметрів. Подібно до виготовлення гістограми для кожної області, але там, де кожен розділ шарується вгорі через однакові проміжки часу. Це потрібно розглядати з 3D, що означатиме, що частина його буде затемнена.


Я люблю, і я маю на увазі всі ваші пропозиції. Я планую реалізувати 1-> 4. Однак для 3D-речей: я вважаю, що коли ви робите 3d карти, в центральних районах міста, як правило, розташовані в центрі міста, виходить більшість висот, блокуючи безліч зон за ними
dassouki

@dassouki - Я згоден, що так буває. Можливо, ви могли б використовувати змінну, яка для цього не має величезного діапазону (середній вік?), Або, якщо вона є, ви можете логарифмічно її перетворити.
djq

3
@celenius Цікаве запитання щодо можливої ​​надмірності: щільність населення - це кількість людей щодо площі ; кількість людей - це абсолютна кількість; та кількість домогосподарств дає інформацію про те, як люди живуть разом. Хоча ці три змінні, очевидно, пов'язані між собою (і можуть створювати проблеми майже колінеарності у регресіях), вони насправді є трьома різними відомостями. До речі, це "хороплет". (На щастя, Google визнає цю помилку та все-таки здійснює призначений пошук.)
whuber

1
@whuber - Я думаю, що це, мабуть, зроблено за допомогою спалаху (на жаль!).
djq

2
Я дуже підозрілий щодо пропозиції 3D. AFAIK ніхто не показав, що 3D дуже корисний. Посилання на злочин Сан-Фран працює, але лише тому, що його дуже простий - більш складний зразок було б важко розшифрувати. Я не думаю, що в цьому випадку 3D взагалі є шляхом.
Тревесі

2

Це складне завдання. Моя відповідь - перейти з багатовимірною картою. Перевірте цю карту . Карта буде виглядати зайнятою, якщо ви покажете всі змінні на одній карті. Переконайтесь, що ви вибрали відповідну кольорову гаму, якщо вирішите перейти з багатовимірною картою.


Документи Google заблоковані там, де я працюю :(
dassouki


теж не працював, і я не можу зіскрібати його, якщо в кінці не має розширення файлу
dassouki

Ще не йти ....
dassouki

tht - це блок з мого боку. :( Я не проти надсилати вам карту електронною поштою.
Радж

0

Одним ступенем спрощення було б виразити один елемент, наприклад, щільність населення, картограмою, тобто спотворити площу кожної одиниці так, щоб вона була пропорційною чисельності:

Вибори Президента США 2008 року
(джерело: amherst.edu )

Основним недоліком є ​​те, що глядач повинен вміти розпізнавати спотворення зон від їх «звичних» форм.

Більше інформації тут: http://gis.amherstma.gov/data/SpringNearc2009/Session4Cartograms.pdf


1
Я думаю, що це має потенціал, але незрозуміло, наскільки правильно можна застосувати картограми до цієї конкретної ситуації (одночасно переглядаючи декілька атрибутів на одному просторі). Теоретично можна зробити багато маленьких численних картограм, але це може бути важко інтерпретувати (ви втрачаєте послідовність між картами, що є суттєвим для малих кратних). Можливо, картограму можна поєднувати з кольором більш цікавими способами, щоб показати кілька атрибутів.
Енді Ш

1
Приклад невеликих декількох картограм, gisandscience.com/2011/12/07/…
Енді Ш
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.