Я роблю візуалізацію даних. Кожна дата представлена квадратом. Щоб зробити основні дані інтуїтивно зрозумілими, чи повинна довжина сторони кожного квадрата чи площа кожного квадрата бути пропорційною даній, яку він представляє?
Я роблю візуалізацію даних. Кожна дата представлена квадратом. Щоб зробити основні дані інтуїтивно зрозумілими, чи повинна довжина сторони кожного квадрата чи площа кожного квадрата бути пропорційною даній, яку він представляє?
Відповіді:
Якщо ви, творець, не впевнені, як читач дізнається, що це таке?
Коротка відповідь: значення має бути пов’язане 1: 1 із кількістю кольору на сторінці . Отже, у вашому прикладі це повинна бути область. Але є і більше того: вам також потрібно уникати оманливих підказів, які можуть змусити читача неправильно його читати, і вам потрібно знати, чому ви використовуєте область замість довжини (наприклад, діаграми), оскільки вона має реальні плюси і мінуси.
По-перше, ніколи не змінювати і довжину, і ширину (тобто площу) форми, коли фактично змінна пов'язана лише з довжиною однієї сторони. Якщо X подвійний Y, але Y має на чотири рази більше кольорів на сторінці, ви вводите в оману своїх читачів. Цей вид спотворень іноді називають " фактором брехні ", і його часто вважають навмисною спробою ввести в оману та перебільшити розбіжності.
Якщо ви використовуєте площу в якості міри, я настійно рекомендую:
Знаючи, чому ви використовуєте область . Використовуючи область замість лінійного розміру, такого як довжина, ви:
Розглянемо використання кіл для площі, а не квадратів, по центру :
Наприклад, вище, важко не побачити квадрат, позначений як "5", як три чверті висоти квадрата з позначкою "10", тому це потенційно вводить в оману.
Кола не пропонують подібне порівняння: це скоріше на рівні кишечника, миттєвий "Цей крап набагато більший, ніж наступний."
Існує безліч доказів від тестування користувачів до дрібномасштабних досліджень (спробую відшукати деякі приклади пізніше), що подібне інтуїтивне порівняння на основі району може бути більш привабливим, може знизити бар'єр для входу для менш зайнятої аудиторії, і може допомогти утримати увагу читача на темі, а не на холодних деталях номерів. Але це пов'язано з тим, щоб перешкодити більш численному аналізу.
Не вибирайте між одновимірними (довжина чи відстань) та двовимірними (область) з естетичних міркувань: вибирайте між ними залежно від аудиторії та повідомлення.
Що є більш підходящим для спілкування: миттєві порівняння на рівні кишечника на рівні "що набагато більше", або більше розглядаються числові порівняння на рівні "це приблизно 80% від іншого"?
Або є практичні причини, чому вам потрібно використовувати площу?
Потім, коли ви вибрали з практичних причин, застосуйте естетику.
Я б сказав район. В оптичному плані квадрат зі стороною в два рази довше показує площу в 4 рази більше. Випадкові спостерігачі стосуватимуться району, навіть не читаючи вашої легенди.
Гарний приклад - це легендарний графік Рендалл Манро від xkcd :
Ми не так добре оцінюємо різницю в області, як ми за довжиною. Ми використовуємо довжину як проксі, і тому, як правило, недооцінюємо відмінності в областях.
З цієї причини коло, яке насправді має 2х площі іншого, видається занадто малим, оскільки наш мозок пов'язує свої радіуси, які різняться в 1,4 раза.
Існують цікаві спроби узгодити це явище, наприклад, пропорційне картографування символів у R , яке пропонує перцептивне масштабування символів для більш чіткого узгодження з тим, як ми оцінюємо довжину та площу.
Ось рис. 2 з цієї статті
Особисто я не маю цього досвіду і уникаю використання областей, якщо потрібні кількісні судження.
Цікавою дотичною є залежність між сприйняттям обсягу та довжиною. Різниця в тому, як ми сприймаємо їх, ще більше вражає. Це можна проілюструвати у цьому відео зіставлення розмірів зірок .
На той момент, коли ви дістанетесь до найбільшої зірки, яка становить приблизно 1700x діаметр сонця, у вас залишається враження, що вона значно більша за 1700x.
Для більш систематичного погляду на нашу помилку у сприйнятті відмінностей у районах та довжинах див. Графічне сприйняття краудсорсингу: Використання Механічного Турка для оцінки дизайну візуалізації Джефрі Хера та Майкла Бостока.
На мій погляд область (D), а не кожна сторона (E).
Якщо ви використовуєте сторону довжиною 2, то площа була б у 4 рази більша, і у вас був би дуже перекритий графік. (Е)
Якщо у вас є звичайна гістограма (A), дані лінійні, а з смужкою - лише для естетичного. (B)
У цих випадках область знову є репрезентативною за даними, оскільки смуги з брусками однакові. Ви можете мати тривимірну панель, і все-таки об'єм смуги представляє дані (C)
Туфте займався цим широко. Побачити:
Деякі принципи графічної цілісності:
- Представлення чисел, фізично виміряних на поверхні самого графіка, повинно бути прямо пропорційним представленим числовим величинам
- Чітке, детальне та ретельне маркування слід використовувати для перемоги графічного спотворення та неоднозначності. Випишіть пояснення даних на самому графіку. Позначте важливі події в даних.
- Показати варіацію даних, а не варіацію дизайну.
- У часових рядах відображення грошей, спущені та стандартизовані одиниці вимірювання грошових коштів майже завжди кращі, ніж номінальні одиниці.
- Кількість зображених (змінних) розмірів інформації не повинна перевищувати кількість вимірів у даних. Графіка не повинна цитувати дані поза контекстом.
У вашому випадку ви повинні запитати себе, чи дані краще представлені двовимірним або тривимірним зображенням або лінією. Куб, квадрат і лінія не є однаковими. Це одна з причин, чому 3D-діаграми так часто вводять в оману.