Скільки змінних я можу графічно зобразити, перш ніж втратити ясність?


14

Подивимось, чи можу я пояснити це питання щодо графічної економії, яке я маю правильно. Я новачок у цій галузі, і варто згадати, що це чиста цікавість, і мої приклади - як ви зможете розповісти незабаром - повністю складені.

Скільки змінних я можу графічно представити, перш ніж мій графік втратить якість зв'язку? Припустимо, моя аудиторія - це, наприклад, читачі недільних газет.

Припустимо, у мене є такий набір: вага (х) / вік (у) та дві особи: Джейн, 10 років, 30 кг; і Джо, 20ой, 60кг. Графічне зображення може бути приблизно таким:

введіть тут опис зображення введіть тут опис зображення

Тепер я знаю, що можу додати ще одну змінну, використовуючи розмір гуртків, тому, якщо я хочу додати уявлення про те, скільки гамбургерів Джейн та Джо їдять на тиждень (10 та 20 відповідно), я можу мати щось на зразок:

введіть тут опис зображення введіть тут опис зображення

І я навіть можу використовувати форму або колір + розмір, щоб додати четверту змінну, наприклад, якщо вони їдять більше чізбургерів, ніж яловичі гамбургери (обмеження тут полягає в тому, що тип бургер є булевим, має лише два можливі значення), але все одно:

введіть тут опис зображення введіть тут опис зображення

І тут я думаю, що воно починає безладдя. Додавання фігури до комбінації для відображення п’ятої змінної загрожує «простоті розуміння» графіка. Коли я дивлюся на графік, мій (конкретний) мозок обробляє лише 2 чи 3 змінних, не більше. Вони їдять, наприклад, комбо чи просто гамбургери?

введіть тут опис зображення введіть тут опис зображення

Я подумав, можливо, 3-й вимір, але це виглядатиме просто жахливо. Я, можливо, думаю про це зовсім неправильно, і, швидше за все, я пропускаю щось цілком очевидне, що я не можу зрозуміти (наприклад, якщо спроба представити більше 3 або 4 змінних просто неправильно як практика), але назад до моїх питань:

  • Чи 4 (можливо 5, якщо графік дуже простий, як у мене), розумне число для максимальних змінних, представлених одночасно в двоосі діаграмі?

  • Чи існують інші типи графіків, які дозволяють отримати більше змінних, не втрачаючи ясності?

  • Чи є хороший приклад діаграми, яка успішно представляє велику кількість змінних?

Відповіді:


14

Правка III: Я знайшов надзвичайно чудовий приклад багатовимірної кількісної візуалізації даних, і мені довелося додати його. Ви знайдете його під заголовком "Правка III (Нобелівські лауреати)".

Редагувати II: виникло невелике непорозуміння, і я відредагував спробу уточнити, як я трактую цільове використання даних. Я замінив два зображення і додав розділ "Хочеш смажитися з цим?"


Графіка виявляє дані.

Едвард Туфте:

Безлад та плутанина - це невдачі дизайну, а не атрибути інформації. Безлад вимагає дизайнерського рішення, а не зменшення вмісту. Досить часто, чим інтенсивніша деталізація, тим більше ясності та розуміння, оскільки сенс і міркування невблаганно КОНТЕКСТУАЛЬНІ. Менше - це нудьга.

Чому ми візуалізуємо дані?

  • Інструменти для мислення
  • Показати результат інтенсивного бачення
  • Щоб зрозуміти проблему, прийняти рішення
  • Показати порівняння, проявити причинність
  • Наведіть причини вірити

Як?

  • показати дані
  • спонукають глядача до думки про суть, а не про методологію, графічний дизайн, технологію графічного виробництва чи щось інше
  • не перекручуйте, що дані повинні сказати
  • представити безліч номерів на невеликому просторі
  • зробити великі набори даних когерентними
  • заохочуйте око порівнювати різні фрагменти даних
  • розкрийте дані на кількох рівнях деталізації, від широкого огляду до тонкої структури.
  • служать досить чіткою метою: опис, розвідка, складання та прикраса.
  • тісно інтегруватися зі статистичними та словесними описами набору даних.

Кілька визначень:

Дані:

як правило, вважається "речі, які сортуються в базах даних". Звичайно, це можуть бути цифри, зображення, звук, відео тощо. Дані - це те, що можна збирати, а часто - кількісно. У своєму найпаворотнішому вигляді важко перетравлюється; просто стінки цифр. Ти знаєш; Матриця . Взагалі кажучи, ми не маємо величезні бази даних , що складаються з нулів, для всіх речей ми НЕ маємо, навіть якщо іноді речі , які ми не маємо, речі , які є найбільш інформативними . Таким чином , щоб побачити , що у нас немає, ми повинні представити себе , що ми дійсно маємо.

Інформація:

це те, що ви можете отримати з даних . Показуючи дані якось, ми можемо отримати інформацію . Одним із прикладів, які я часто використовую, є те, що якщо я надам вам список країн світу і скажу вам, що двох немає, дуже малоймовірно, що ви знайдете їх на основі цього списку. Однак якщо я покажу це, розфарбувавши на карті всі країни, які я маю, ви вмить побачите, що я пропустив Центральноафриканську республіку та Нову Каледонію. Це "зменшення шуму" і розповідання історії найбільш ефективним способом.

Інфографіка та візуалізація даних:

Я вагаюся, називаючи вашу приклад інфографікою. Я знаю, що це часто сприймається як синоніми візуалізації даних, дизайну інформації чи архітектури інформації, але я не згоден. Інфографіка - для мене - це низка графіків, діаграм та ілюстрацій, які цілком можуть містити купу упереджених висловлювань про те, як читати дані. Менш об'єктивний, більш схильний пропускати дані, які не є в інтересах творця: ви орієнтуєтесь на висновок, який хтось заздалегідь визначив. Вони мають розважальну цінність, і вони часто мають переважне використання ілюстрацій, що позбавляє певної уваги від даних. Це добре, але я думаю, що нам слід трохи розмежуватися.

Приклади

Основні дані:

Майте на увазі, що великі дані - це не те саме, що складні дані. Багато даних може бути просто однаковим, як, наприклад, ця карта LinkedIn: основні дані однакові, але є фільтри (шляхом позначення). Є дві змінні: географія та якийсь тег, що визначає людей на професії / інтереси / відносини. Божевільний обсяг даних; але лише дві змінні.

введіть тут опис зображення

Багатовимірна:

Ось приклад багатовимірної візуалізації даних. Це графік Чарльза Мінара 1869 року, який показує кількість чоловіків у російській кампанії 1812 року Наполеона, їхні рухи, а також температуру, з якою вони стикалися на зворотному шляху. Велика версія тут. введіть тут опис зображення

Щоб зламати код, потрібно небагато часу, але коли ви це зробите, це чудово. Покриті змінні:

  • чисельність армії (кількість живих / загиблих)
  • географічне положення
  • напрямок (схід - захід)
  • температура
  • час (дати)
  • причинно-наслідковий зв’язок (загинув у боях та холоді)

Це дивовижна кількість інформації в простій, двоколірній карті. Географічна частина стилізована, щоб дати можливість іншим змінним, але ми не маємо проблем з цим.

Ось більш хитра. Це буде набагато простіше прочитати, якщо ви ознайомитеся з основними еволюційними візуалізаціями, кладограмами, філогенікою та принципами біогеографії. Майте на увазі, що він зроблений для людей, знайомих з цим, тому це спеціальна наукова карта. Ось що це показує: Філогеографічне зображення родів отруйних жаб з Південної Америки. Карти зліва показують основні біогеографічні регіони, оскільки вони змінюються в часі, а зображення праворуч показує лінії жаб в контексті їх біогеографічного походження. (За матеріалами Santos JC, Coloma LA, Summers K, Caldwell JP, Ree R та ін. [CC-BY-SA-2.5 (www.creativecommons.org/licenses/by-sa/2.5)], через Wikimedia Commons). Коли ви "зламаєте код", він дико, дивно інформативний.

введіть тут опис зображення

Невеликі кратні блискітки:

Я не можу наголосити на цьому достатньо: ніколи не варто недооцінювати значення повторюваної інформації чи розділяти її на окремі однакові візуалізації. Поки порівняти один графік з іншим досить просто, це абсолютно чудово. Ми - машини пошуку тексту. Це часто називають маленькими кратними. У нас є досить багато проблем з аналізом цих зображень, і чіпляти все в один великий графік часто безглуздо, коли десять малих будуть працювати ще краще:

введіть тут опис зображення

Інший:

введіть тут опис зображення

І той, що використовує різні, але повторювані графіки:

введіть тут опис зображення

Іскраві лінії - це термін, придуманий Едвардом Туфте, а також перетворений у повністю функціонуючу, повністю настроювану бібліотеку JavaScript. Вони є в основному крихітними діаграмами, які можна вставити в текст, як частину тексту, а не як "зовнішній" об'єкт. Ось як виглядає за замовчуванням: введіть тут опис зображення

Редагувати III (Нобелівські лауреати)

Мені просто довелося додати цю візуалізацію даних, яку я знайшов, це просто занадто добре: вона показує нобелівських лауреатів. Який університет, який факультет, предмет, рік, вік, рідні міста, чим це було поділено, рівень ступеня. Справді прекрасні докази. Це все кількісно вимірювані дані. Більше тут.

введіть тут опис зображення

введіть тут опис зображення

Ваші дані

Усі питання @Javi ставлять надзвичайно важливо.

Що ви намагаєтеся зробити, це створити наочний інструмент для мислення. Для цього потрібно отримати найкращу якість співвідношення сигнал / шум. З чим ви боретеся - це співвіднесення даних, що мають різні змінні, в інформацію . Ось питання: що має бути приблизно правильним і що має бути саме правильним? Яка мета?

Я припускаю, що ви хочете відображати дані без особливої ​​упередженості: ви хочете, щоб читач сам знаходив кореляції, якщо є якісь кореляції. Ваша мета полягає не в тому, щоб сказати людям, що гамбургери погано для них або що жінки їдять менше гамбургерів, ніж чоловіки, а дозволити їм "бачити" це, якщо саме це містять дані (уявіть, якби ці три людини були сім'єю. Це було б розгойдуємо наш погляд на всю бургер-їжу-графік тад).

Ваш набір даних настільки крихітний, що ви можете просто помістити його в таблицю, і це буде добре. Але звичайно мова йде про загальну ідею:

Невелика деталь: час (вік), як правило, вважається горизонтальним зліва направо (часові рамки). Важте щось, що знаходиться вниз, тому переключення вашого x - y було б хорошою ідеєю.

1. Які унікальні, нерухомі сутності?

  • Імена

2. що таке змінні (е ..)?

  • Вага (кг)
  • Вік (років)
  • Кількість гамбургерів (ціле число)
  • Тип гамбургера (ціле число)

Примітка: ваші дані повністю складаються з одиниць. Лічильний, кількісно вимірюваний кожен на окремому ментальному масштабі. Кіло, вік, вага та цифри. А в базі даних говорять, їх імена є ключами. Коли ви починаєте робити візуалізації в просторі, це стає справжнім головним болем. Уявіть, що вам слід додати місце народження, поточний дім тощо.

Єдині два, у яких є кореляція, - це кількість гамбургерів і більше, або ні, це комбо. Усі інші змінні є незалежними, і лише одна є фіксованою (ім'я). У якийсь момент із великими наборами даних навіть імена стають нецікавими, і їх замінюють демографічні, вікові, статеві чи подібні.

За допомогою цього крихітного набору даних ви зможете отримати все це в одному графіку, наприклад, таким: введіть тут опис зображення

Або ви можете змінити зміст осі та вмісту міхура:

Особиста примітка: Я думаю, що це краще з двох, тому що x і y містять "фізичні" властивості людини. Змінна в бульбашках тут - кількість гамбургерів.

введіть тут опис зображення

Ви також можете додавати кругові діаграми на додаток до графіка або навіть мати лише кругові діаграми. Особисто я мав би і те, і інше, як згадувалося про малі кратні: введіть тут опис зображення

Ви хочете фрі з цим?

Моє припущення було те, що ми також хотіли знати співвідношення гамбургерів до їжі. Кожна їжа містить бургер. Не всі страви є спільними.

  1. чи хочемо ми лише знати, чи людина іноді їсть комолі?
  2. або ми хочемо знати, скільки страв з гамбургерів також є спільними?

Якщо 1., булева застосована до імені / ключа / id.

Джейн іноді їсть комолі? Правда / хибність.

Якщо 2. ми можемо застосувати булеву до кожного прийому їжі:

1 чизбургер, комбомальний = справжній

1 чизбургер, комбомальний = справжній

1 чизбургер, комбамальний = помилковий

1 чизбургер, комбамальний = помилковий

1 чизбургер, комбамальний = помилковий

1 чизбургер, комбамальний = помилковий

1 чизбургер, комбамальний = помилковий

1 яловичий бургер, комбомальний = справжній

1 яловичий бургер, комбомальний = справжній

1 яловичий бургер, комбомальний = хибний

Це дуже нудно, тому ми можемо розбити це на:

Джейн їсть 10 гамбургерів. З них три - комбо ("чи хочеш, щоб фрі з цим?").

Одним із комбайнів є меню з яловичиною.

Двоє із комодалів - це чизбургерське меню.

Решта - це одиночні бургери. 5 сиру, дві яловичини.

Ця схема була спробою візуалізувати це. Я в цій версії зберігав пиріжки, щоб було зрозуміліше. Річ у цьому полягає в тому, що починати застосовувати великі набори даних і% було б не стрибком: введіть тут опис зображення

Але я думаю, що найкращий спосіб - переосмислити.

Ще один спосіб поглянути на це - зробити це дійсно дуже просто. Тут простіше зрозуміти, які вікові групи, які вагові групи та всі дані, які ви не маєте, можуть нам сказати. Дані, які ви маєте, не пов'язані з космосом, це лише одиниці (кг, роки, цифри + ключ / id / ім’я):

(Редагувати: Яйце на моєму обличчі: я замінив ці зображення на більш правильні, оскільки "всі страви - це гамбургери, а не всі страви - комбо")

введіть тут опис зображення Це було б досить легко розширити більше людей:

введіть тут опис зображення Або, що ще краще, якщо порівнювати вікові групи 10, 20 та 30 років, ви можете зробити досить простий для читання статистичну візуалізацію:

введіть тут опис зображення

..І просто щоб бути максимально зрозумілим; ось приклад такого способу мислення. Ця діаграма показує вижили на Титаніку, співвідношення екіпажу, класу, чоловіків, жінок. введіть тут опис зображення

Буде маса інших рішень, це лише кілька думок.

Я міг би продовжувати і продовжувати, але зараз я виснажив себе і, мабуть, усіх.

Інструменти для гри:

гефі

Gapminder Дивіться цю феноменальну презентацію TED Ганса Рослінга - любите цього хлопця

Діаграми Google

сомвіс

Рафаель

Виставка MIT (раніше називалася Similie)

d3

Високі показники

Подальше читання:

PJ Onori; На захист важко

Едвард Туфте: Прекрасні докази

Едвард Туфте: Проведення інформації

Едвард Туфте: Візуальне відображення кількісної інформації

Візуальні пояснення: образи та кількості, докази та розповідь

Чоловік, Алан., 2007 Ілюстрація теоретичної та контекстуальної перспективи Лозанна, Швейцарія; Нью-Йорк, Нью-Йорк: AVA Academia

Isles, C. & Roberts, R., 1997. У видимому світлі, фотографії та класифікації в мистецтві, науці та побуті, Оксфордський музей сучасного мистецтва.

Card, SK, Mackinlay, J. & Shneiderman, B. eds., 1999. Читання з інформаційної візуалізації: Використання бачення для думки 1-е видання, Морган Кауфман.

Графтон, А. та Розенберг, Д., 2010. Картографії часу: історія часової шкали, Принстонська архітектурна преса.

Ліма, М., 2011. Візуальна складність: картографування моделей інформації, Прінстонська архітектурна преса.

Bounford, T., 2000. Цифрові діаграми: як ефективно конструювати та подавати статистичну інформацію 0 ред., Уотсон-Гуптілл.

Steele, J. & Iliinsky, N. edds., 2010. Прекрасна візуалізація: погляд на дані очима експертів 1-е видання, O'Reilly Media.

Gleick, J., 2011. Інформація: історія, теорія, потоп, пантеон


Я все це прочитав, але на те, щоб засвоїти, знадобляться тижні. Вам слід написати книгу!
Джошуа Френк

Для зображення Нобелівської премії ви знаєте, як вони це зробили? Ті проточні стрічки просто красиві.
Джошуа Френк

Ні, я не знаю, як саме вона це зробила, але Джорджія Лупі вже найближчим часом відповідає на деякі інші питання, тож ви можете спробувати просто задати їй giorgialupi.net
benteh

Гей, гарна ідея. Я щойно надіслав їй електронний лист.
Джошуа Френк

2
Ви заслужили приз на новела за цю відповідь n_n
Рафаель,

5

Я думаю, що є кілька додаткових запитань, які можуть звузити пошук ключових для представлення даних вашій аудиторії. Я думаю, що вони дуже схожі на скорочення вашого резюме на конкретну роботу, яку ви хочете.

  1. Чому ви створюєте інфографіку.
  2. Яку мету чи результат ви хочете, щоб ваша аудиторія знала про ваші дані.
  3. Що ви знаєте про свою аудиторію та як вони ставляться до даних. (Демографічний вік, стать, геолокація, вага тощо)
  4. Що є найбільш важливим і найменш важливим фрагментом даних, який ви будете показувати, та різницею між ними.
  5. У якому середовищі / контексті ви будете відображати свої дані, щоб найкраще досягти вашої "чистої" мети для їх створення в першу чергу? Наприклад, це буде цифрове представлення даних або фізичне (подумайте, що квасоля в баночці, якщо ваша цільова аудиторія - діти). Це буде офісна зустріч чи комерційне підприємство?
  6. Чи можна розділяти дані на різні інфографіки, зберігаючи цілісність своєї мети для їх створення.

Ваші дані та мета повинні диктувати умови того, що ви повинні показувати, а не показувати. Наприклад, як важливо було б показати графік того, що люди замовляли в McDonald's у вівторок між 13:00 та 15:00, коли вашою ціллю було лише показати порівняння того, що замовляли люди взагалі. Змінна часу не потрібна, навіть якщо ми маємо для цього необроблені дані. Це не було нашою метою.

Щоб спеціально відповісти на ваші запитання. Я особисто (суб'єктивно) думаю , коли ви отримуєте за допомогою three'ish / 4 змінні (розмір, форма, колір, положення) в базовій схемі , як це, читач (я) набридне / втратив і нудно / втратив, ймовірно , НЕ причина створення графіка Однак вони можуть бути цілком веселими і по-справжньому залучати аудиторію. Наприклад, що - щось на зразок цього , як протистояти цим . Я не оминаю важливості другого прикладу, тому що це була б дійсно ефективна інфографіка, якби я був на зустрічі в офісі, де було показано загальні дані. Це повертається до питання про середовище та контекст показу даних.

Якщо ви шукаєте способи відображення змінних даних, я б запропонував вивчити інфографіку. Ось хороший стартовий фрагмент журналу Smashing щодо створення ефективної інфографіки. Майте на увазі, що щось із цього може і є суб'єктивним.


2

Це відмінне запитання. Воістину.

Блискуча лінія думки продовжуватись.

Про це має бути певна дискусія. Але я б сказав це дещо інакше:

**

Скільки властивостей ми можемо перехрестити з сучасними ілюстративними технологіями та дизайном?

**

Відповідь полягає в трьох аспектах виробництва: дисплеї, дизайні та режимі викладу ... все це поєднуються та враховуються сплесками розгляду аудиторії.

Дисплей - це фізична річ. За обмеженнями розміру, роздільної здатності та кольорового простору.

Дизайн необмежений, але справжній цікавий аспект цього питання. Як ми можемо використовувати сучасні ілюстративні технології та наше розуміння дизайну та творчості, щоб якнайкраще показати.

Режими презентації є статичними, динамічними або інтерактивними. Кожна людина має свої сильні та слабкі сторони та ускладнюється середовищем, типом та розміром дисплея.

І як справедливо зазначає Джаві, але, можливо, недостатньо далеко з ... ЦЕ ВСЕ СУБЕКТИВНО! - Це сплеск врахування аудиторії, що входить в рівняння. Чи ні.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.