Чи повинна площа або довжина квадрата пропорційні даних, які візуалізуються?


16

Я роблю візуалізацію даних. Кожна дата представлена ​​квадратом. Щоб зробити основні дані інтуїтивно зрозумілими, чи повинна довжина сторони кожного квадрата чи площа кожного квадрата бути пропорційною даній, яку він представляє?


1
Ще ні. Він широкий? Я сподівався, що відповідь була однозначною (я припускаю, що це "область"), але цей народ матиме більше графічного дизайну та знання перцептивної психології для підтвердження цього.
dumbledad

1
IIRC про це висвітлювалося в німецькій книзі, яку я прочитав одного разу "So lügt man mit Statistik" від en.wikipedia.org/wiki/Walter_Krämer - не впевнений, чи є англійський еквівалент. TL; DR - залежить від того, що ви хочете, щоб ваші читачі читали з візуалізацій.
Майкл Шумахер

Відповідь, безумовно, не є однозначною. Все залежить від конкретних особливостей, а саме: які дані ви представляєте, як ви їх представляєте, і що ви хочете спілкуватися із зазначеними даними.
DA01

Чи можете ви навести приклади, коли специфіка або те, що ми хочемо, щоб читачі читали з візуалізації, призвели до того, щоб ми вирішили зробити довжину сторони квадрата пропорційною даті замість площі квадрата?
dumbledad

5
+1 Чому кожне цікаве запитання приваблює хоча б один закритий голос?!? <grump>
користувач56reinstatemonica8

Відповіді:


10

Якщо ви, творець, не впевнені, як читач дізнається, що це таке?

Коротка відповідь: значення має бути пов’язане 1: 1 із кількістю кольору на сторінці . Отже, у вашому прикладі це повинна бути область. Але є і більше того: вам також потрібно уникати оманливих підказів, які можуть змусити читача неправильно його читати, і вам потрібно знати, чому ви використовуєте область замість довжини (наприклад, діаграми), оскільки вона має реальні плюси і мінуси.


По-перше, ніколи не змінювати і довжину, і ширину (тобто площу) форми, коли фактично змінна пов'язана лише з довжиною однієї сторони. Якщо X подвійний Y, але Y має на чотири рази більше кольорів на сторінці, ви вводите в оману своїх читачів. Цей вид спотворень іноді називають " фактором брехні ", і його часто вважають навмисною спробою ввести в оману та перебільшити розбіжності.

введіть тут опис зображення


Якщо ви використовуєте площу в якості міри, я настійно рекомендую:

  • Знаючи, чому ви використовуєте область . Використовуючи область замість лінійного розміру, такого як довжина, ви:

    • Пожертвуйте здатністю чітко бачити відмінності математично (ви не можете легко сказати "дивіться, це вдвічі більше іншого")
    • Запропонуйте своїм читачам переглядати це на інтуїтивно зрозумілому повсякденному нечисловому способі, як люди, наприклад, порівнюють розміри пирогів у магазині. Менш витончений, але більш безпосередній. Більше кишок, менше голови.
    • Невеликі відмінності між дуже подібними числами стають майже непомітними.
    • Коли одна змінна у багато разів менша, ніж інша, дуже маленька не зникає так погано, як це було б на смужковій діаграмі, що може забезпечити більшу гнучкість у компонуванні.

введіть тут опис зображення

  • Розглянемо використання кіл для площі, а не квадратів, по центру :

    • Кола, оскільки це не викликає плутанини з гістограмами тощо. Висота та ширина менше на перший план: це виглядає менш, як ви запрошуєте порівняння по висоті чи ширині.
    • Вирівнювання по центру, оскільки воно не пропонує людям порівнювати висоти

введіть тут опис зображення

Наприклад, вище, важко не побачити квадрат, позначений як "5", як три чверті висоти квадрата з позначкою "10", тому це потенційно вводить в оману.

Кола не пропонують подібне порівняння: це скоріше на рівні кишечника, миттєвий "Цей крап набагато більший, ніж наступний."


Існує безліч доказів від тестування користувачів до дрібномасштабних досліджень (спробую відшукати деякі приклади пізніше), що подібне інтуїтивне порівняння на основі району може бути більш привабливим, може знизити бар'єр для входу для менш зайнятої аудиторії, і може допомогти утримати увагу читача на темі, а не на холодних деталях номерів. Але це пов'язано з тим, щоб перешкодити більш численному аналізу.

Не вибирайте між одновимірними (довжина чи відстань) та двовимірними (область) з естетичних міркувань: вибирайте між ними залежно від аудиторії та повідомлення.

Що є більш підходящим для спілкування: миттєві порівняння на рівні кишечника на рівні "що набагато більше", або більше розглядаються числові порівняння на рівні "це приблизно 80% від іншого"?

Або є практичні причини, чому вам потрібно використовувати площу?

Потім, коли ви вибрали з практичних причин, застосуйте естетику.


"Пропорційна кількість кольору на сторінці" є дуже корисним правилом (принаймні в 2D); дякую за це я буду його використовувати. Дизайн, до якого я переїжджаю, базується на колах, я думаю, що ви тут
dumbledad

5

Я б сказав район. В оптичному плані квадрат зі стороною в два рази довше показує площу в 4 рази більше. Випадкові спостерігачі стосуватимуться району, навіть не читаючи вашої легенди.

Гарний приклад - це легендарний графік Рендалл Манро від xkcd :

введіть тут опис зображення ( величезна, розбірлива версія )


4

Ми не так добре оцінюємо різницю в області, як ми за довжиною. Ми використовуємо довжину як проксі, і тому, як правило, недооцінюємо відмінності в областях.

З цієї причини коло, яке насправді має 2х площі іншого, видається занадто малим, оскільки наш мозок пов'язує свої радіуси, які різняться в 1,4 раза.

Існують цікаві спроби узгодити це явище, наприклад, пропорційне картографування символів у R , яке пропонує перцептивне масштабування символів для більш чіткого узгодження з тим, як ми оцінюємо довжину та площу.

Ось рис. 2 з цієї статті

введіть тут опис зображення

Особисто я не маю цього досвіду і уникаю використання областей, якщо потрібні кількісні судження.

Цікавою дотичною є залежність між сприйняттям обсягу та довжиною. Різниця в тому, як ми сприймаємо їх, ще більше вражає. Це можна проілюструвати у цьому відео зіставлення розмірів зірок .

На той момент, коли ви дістанетесь до найбільшої зірки, яка становить приблизно 1700x діаметр сонця, у вас залишається враження, що вона значно більша за 1700x.

Для більш систематичного погляду на нашу помилку у сприйнятті відмінностей у районах та довжинах див. Графічне сприйняття краудсорсингу: Використання Механічного Турка для оцінки дизайну візуалізації Джефрі Хера та Майкла Бостока.


4

На мій погляд область (D), а не кожна сторона (E).

Якщо ви використовуєте сторону довжиною 2, то площа була б у 4 рази більша, і у вас був би дуже перекритий графік. (Е)

Якщо у вас є звичайна гістограма (A), дані лінійні, а з смужкою - лише для естетичного. (B)

У цих випадках область знову є репрезентативною за даними, оскільки смуги з брусками однакові. Ви можете мати тривимірну панель, і все-таки об'єм смуги представляє дані (C)

Графіки, що ілюструють розмір перцептивних відмінностей та перекриття


4 рази? Чи не різниця між лінійним та квадратним?
дамблід

Дозвольте мені проілюструвати та відредагувати публікацію.
Рафаель

Припустимо, дата - 81. Якщо ми будемо використовувати площу, сторони мають довжину 9, даючи площу 81. Якщо ми зробимо сторони, то вони мають довжину 81, а площа - 6561. 81 не 4 рази 9, а 6561 - не 4 рази 81. Звідки ви берете 4?
dumbledad

"Якщо ви використовуєте сторону довжиною 2, то площа буде в 4 рази більше значення" Я не можу сказати, що ви намагаєтесь сказати там. Я думаю, ви маєте на увазі, що якщо ви використовуєте довжину сторони для відображення величини даних, подвоєння значення даних множить область на чотири.
Девід Річербі

Девід - ось моя редакція! У початковому дописі Рафаеля сказано, що "якщо ви використовуєте сторону, площа буде в 4 рази більша за значення". Якщо ви знаєте кращий спосіб уточнити це, будь ласка.
dumbledad

1

Туфте займався цим широко. Побачити:

  • Візуальне відображення кількісної інформації,
  • Представлення інформації та ін.

Деякі принципи графічної цілісності:

  1. Представлення чисел, фізично виміряних на поверхні самого графіка, повинно бути прямо пропорційним представленим числовим величинам
  2. Чітке, детальне та ретельне маркування слід використовувати для перемоги графічного спотворення та неоднозначності. Випишіть пояснення даних на самому графіку. Позначте важливі події в даних.
  3. Показати варіацію даних, а не варіацію дизайну.
  4. У часових рядах відображення грошей, спущені та стандартизовані одиниці вимірювання грошових коштів майже завжди кращі, ніж номінальні одиниці.
  5. Кількість зображених (змінних) розмірів інформації не повинна перевищувати кількість вимірів у даних. Графіка не повинна цитувати дані поза контекстом.

У вашому випадку ви повинні запитати себе, чи дані краще представлені двовимірним або тривимірним зображенням або лінією. Куб, квадрат і лінія не є однаковими. Це одна з причин, чому 3D-діаграми так часто вводять в оману.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.