Форматування графіків: коли доцільно використовувати заливку під лінійним графіком?

13

Це питання візуалізації даних - я сподіваюся, що це нормально запитати тут.

Коли доцільно використовувати заливку під лінійним графіком для часового ряду, як графік нижче? (що показує пінг-раз протягом дня)

Лінійний графік із заповненням під ним

Я думаю, що звичайніше використовувати звичайну лінію, без заливки внизу, але чи нормально використовувати заливку для візуальної різноманітності?

Мені б особливо цікаво дізнатись про будь-яке перцептивне дослідження з даної теми чи будь-які посібники зі стилів.

data-visualization

— Річард
джерело

1

Якщо 0sприродна нижня межа і ви її показуєте, то чому б ні?

— ttnphns

1

Запитайте інший спосіб - навіщо використовувати заливку, якщо це не потрібно? Уявіть, що ви хочете додати ще одну лінію тренду, і все зайво ускладнюється. Я також би розділяв одиницю (-и) осі і масштаб.

— Мартін

11

Існує трохи мистецтва, щоб збалансувати естетичні та інформативні аспекти графіки. Видатні консультанти з візуалізації / такі автори, як Едвард Туфте та Стівен Мало хто вибирають мінімальну естетику, що дозволяє уникнути відволікання від інформативних частин графіка. Однак для деяких аудиторій виправдана невелика кількість - див., Наприклад, журналістське застосування візуалізації даних Альберто Каїра.

Перцептивний кут дослідження полягає в тому, що кожен графічний елемент передає повідомлення, яке ми не усвідомлюємо, оскільки наша візуальна кора займається цим (" попередня уважна обробка "). Додаткові елементи, навіть зайві, можуть призвести до додаткової обробки. Відповідний графік залежить від повідомлення, яке слід повідомити, та аудиторії.

До вашого конкретного питання пов'язана лінія підкреслює тенденцію (і відмінність від тренду). Заповнена область підкреслює відхилення від базової лінії. Штрих-діаграма або голкова діаграма підкреслюють окремі події, що відхиляються від базової лінії.

Важливий і контекст графіки. Якщо у вас є сітка щільно упакованих графіків, заливка допоможе пов’язати кожен рядок із його базовою лінією.

Нарешті, ще одна думка щодо додавання зайвих графічних елементів / флоришей полягає в тому, що це ускладнює розширення графіка більш інформативними елементами. Наприклад, ви можете виділити спеціальні значення, накладати інші лінії тренду або смуги накладання, наприклад, у наступному макеті.

введіть тут опис зображення

— ксан
джерело

1

Я згоден з цим. Якщо графік не повинен бути барвистим, оскільки це лицьова обкладинка журналу / книги (а маркетингові люди хочуть, щоб вони були кольоровими), для інформування слід використовувати колір. Якщо графік виглядає «нудно», то винуватцем є той факт, що базова інформація зовсім не дуже цікава або не дуже цікава у форматі лінійного графіка. У таких випадках, можливо, це буде корисніше в круговій діаграмі, радарному сюжеті чи щось інше.

— rocinante

1

Я пропоную не використовувати кругову діаграму. Важче сприймати відмінності в довжині дуги та площі клина, ніж різниці у висоті. Якщо ви мені не вірите, порівняйте кругову діаграму у співвідношеннях 32:34:33 з тією ж гістограмою. Який легше читати?

— shadowtalker

2

Я виступав у загальних рисах, а не конкретно для вищевказаного графіка. Кожен тип діаграми має свої достоїнства. Певний тип діаграми не підходить у всіх ситуаціях.

— rocinante

4

Ще кілька моментів, які слід врахувати:

Як зазначалося в коментарі, недосип в основному недоцільний, якщо вісь x не знаходиться в натуральній точці y. Це може бути тому, що вісь y масштабується так, щоб вона починалася з числа, відмінного від нуля, або тому, що використовувані одиниці не мають інтерпретації природного нуля (наприклад, у Кельвіна є природний нуль, тоді як Цельсій -.)

По-друге, випадок, коли недооцінка є особливо валідною, якщо самі дані можна вважати недоповненими. Наприклад, лінійна діаграма висоти гори має сенс бути недостатньою, колір заливки являє собою землю, а незаповнений являє собою повітря.

Спорідненим прикладом можуть бути дані підрахунку. Якби ми склали всі особи в кожній точці x, ми отримали б діаграму. Якщо інтерполяція між брусками має сенс, ми закінчилися лінійною діаграмою із недоліком.

Цей образ із "візуального відображення кількісної інформації" може пояснити це трохи краще. Це показує, які військові частини були в Європі під час другої війни (я думаю). Укладання одиниць у кожній часовій точці дає вам занижену діаграму. Нанесення лінії вгорі даних дає недовиконану лінійну діаграму.

— timcdlucas
джерело

2

... Військові частини США були в Європі під час Першої світової війни (дати 1917 та 1918 рр. Розповідають історію).

— Нік Кокс

@nickCox Звичайно. Не маю ідеї, чому я цього не бачив.

— timcdlucas

4

Попередні дві відповіді охоплюють основні важливі моменти, але є кілька речей, які все ж слід зазначити.

По-перше, я повинен сказати, що я не погоджуюся з надзвичайно мінімалістичним підходом до графіки - що вся зайва чорнило повинна йти. Відволікаюча, безглузда зміна повинна йти. Але суцільна площа проти однієї лінії може краще привернути увагу і більше спілкуватися з першого погляду. І як ви кажете, це може додати "візуальну різноманітність".

Однак, як вказує @xan, цей швидкий погляд також трактує область інакше, ніж лінія, частково підсвідомо.

Графік площі передбачає загальну кількість, що накопичується під час руху по осі x. Якщо ви порівнюєте два графіки, а на одному заповнена більша площа, ваш погляд підкаже вам, що він має більший загальний результат незалежно від початкового та кінцевого значень.

Навпаки, лінійний графік показує змінне значення. Основна увага зосереджена на зміні положення від однієї точки до іншої, а не на загальному накопиченому.

Тож коли слід використовувати графік площі?

коли значення представляють чітку величину з визначеною нульовою точкою, показаною на графіку;
коли значення являє собою додану (або видалену) суму в кожній точці, таку як звичайна щоденна кількість опадів або щомісячний прибуток / збиток;
коли значення являє собою розподіл сукупності, означає, що загальна площа під кривою представляє загальний розмір вибірки, наприклад крива дзвону кількості учнів з різними класами (в основному згладжена гістограма).

Ідея полягає в тому, що, читаючи графік, якщо взяти дві осі на осі x, область, показана між ними, повинна представляти фактичну кількість чогось, що накопичується в цьому діапазоні. З цієї причини, якщо ви включаєте в себе негативні суми, я рекомендую використовувати протилежні кольори для негативних та позитивних областей, щоб підкреслити, що вони відміняються в загальній кількості.

Коли ви повинні НЕ використовувати область графіка?

коли нульова точка є довільною (як у неабсолютній температурі, як сказав @timcdlucas), недійсною (як у вимірах, що є співвідношенням двох значень, як обмінний курс), або не показана на графіку з просторових причин;
коли значення, показані на висоті рядка, вже представляють сукупний захід, такий як загальна кількість опадів на сьогодні (за місяць / рік) або борг / заощадження;
коли значення представляють позицію / значення одного змінного об'єкта, а не накопичення;
коли ви хочете порівняти кілька рядків на одному графіку (якщо ви не бачите всієї області, ви втрачаєте значення - замість цього порівняйте діаграми площ).

Маючи на увазі ці вказівки, ваш графік ping можна інтерпретувати двома способами.

З одного боку, якщо ви вважаєте швидкість пінгу як єдину змінну, яка змінюється протягом дня, то найпростішою лінійною діаграмою було б найбільш доречно.

З іншого боку, якщо ви порівнювали щоденні схеми швидкості пінг-сигналу двох різних мереж (або одну і ту ж мережу в різні дні / час), можливо, ви хочете підкреслити загальну кількість часу, необхідну для виконання завдань мережі. Наприклад, якщо ваш графік мав декілька піків, а не лише один, лінійний графік підкреслює мінливість швидкості, а графік області підкреслює загальну затримку.

Порівняйте:
Лінійний графік Той самий графік із заповненою площею
Загальна сума в першій половині графіка (ліворуч від червоної лінії) трохи більша, ніж у другій, навіть якщо піки досягають більш високих максимальних значень справа. Заповнення підкреслює той суцільний блок зліва, щоб він краще врівноважувався проти вершин.

(Вибачте за низьку якість зображення - не вдалося зрозуміти, як змусити R робити графік області! Довелося експортувати та редагувати окремо.)

— AmeliaBR
джерело