Чи неправильно використовувати графіки ліній для дискретних даних?


12

Я часто бачив дискретні набори даних, побудовані у вигляді графіків ліній, але мені здається, що лінія визначає значення в точці між інтервалами вимірювання, що не має сенсу для дискретних наборів даних. Чи не так це використання лінійних графіків для дискретних даних неправильно?

Як приклад, візьміть два набори даних часового ряду, один безперервний (моя вага, вимірюється щодня вранці) та один дискретний (кількість пончиків, які я їмо в день). Перший набір даних має сенс бути лінійним графіком, оскільки розумно зробити висновок, що моя вага в будь-який день дня буде пов'язаний з моєю вагою попереднього та наступного ранку. Однак якщо кількість пончиків представлена ​​у вигляді лінійного графіка, то рядки між крапками не можуть виводити значення з цього рядка.

EDIT

Ось ще один приклад: мінімальна погодинна мінімальна заробітна плата з моменту її створення за адресою http://mste.illinois.edu/courses/ci330ms/youtsey/lineinfo.html

Якщо я не помиляюся, зміни мінімальної заробітної плати є дискретними, а значить, неможливо шукати якийсь довільно вибраний час та встановити мінімальну заробітну плату в точці, використовуючи лінію, що з'єднує крапки.


3
(+1) Приклад погодинної мінімальної заробітної плати є відмінним. Саме фразування вашого запитання наводить хорошу відповідь: а саме те, що з'єднувальні точки на графіку не є дійсними, коли це призведе до того, що читач зробить неточні (або зовсім недійсні) інтерполяції. Розмежування дискретності та розриву допоможе в подальшому аналізі: споживання пончиків є дискретним, тоді як мінімальна заробітна плата припиняється. Кожен заслуговує на різну форму сюжету.
whuber

Є сюжети, де ділянка розсіяння з дискретними даними вводить в оману по лінії лінії. Для випадків, коли є необхідна послідовність подій (гістерезис) або коливання між двома рівнями виникають і потрібно відстежувати зміни стану та їх розташування. Отже: не використовуйте графіки ліній для інтерполяції, а використовуйте їх як керівництво, якщо це доречно. Це не досить просто, щоб зробити максимум простим правилом вибору, але потребує врахування даних та моделі.
wirrbel

1
Цікаве запитання! Дякую за це. Я маю справу з великою кількістю даних, пов'язаних із часом, які частково випливають із дискретних моделей та частково вимірюваних даних. А як щодо можливості використання ступінчастих графіків ліній для дискретних даних (які можуть бути безперервними певним чином, але ми все одно не маємо функції між окремими точками і не можемо просто припустити, що вони мають) та звичайних для безперервних даних? Саме так я маю справу з цим ..
Cord Kaldemeyer

@CordKaldemeyer дякую за коментар - мені не було відомо про тип діаграми "крок за кроком лінії", але це точно те, що я шукаю. Я також знайшов цей корисний підручник з того, як робити поетапні
сюжетні

@ user1379351: Радий, що можу допомогти!
Cord Kaldemeyer

Відповіді:


9

Діаграми підключених ліній виявилися занадто корисними, щоб обмежитися однією інтерпретацією. Кілька визначних цілей:

  • Інтерпольовані значення . У випадку, коли ви згадуєте, коли обидві змінні є безперервними і кожна інтерпольована точка вздовж лінії є змістовною інтерпретацією.
  • Швидкість зміни . Навіть коли значення проміжків не мають сенсу, нахил кожного сегмента рядка є гарним поданням швидкості зміни. Зауважте, що для такої інтерпретації значення X та Y повинні бути розміщені належним чином, що не стосується наведених вами графіків заробітної плати.
  • Порівняння профілю . Порівнюючи невеликі кратні чи накладені заходи, рядки можуть бути корисними навіть для категоричних факторів. У цьому випадку рядки служать для з'єднання груп відповідей для обмеженого розпізнавання шаблонів. Ось приклад із peltiertech.com з коефіцієнтом на вісь Y (замість X) для читабельності міток:

введіть тут опис зображення


1
Щоправда, але 2-й та 3-й графіки суворо менш потужні, ніж перший, оскільки обчислення взагалі не можна використовувати.
Milind R

5

Ну, пончики можуть бути пов’язані з вагою :-)

Хоча я бачу вашу думку, я вважаю, що цей приклад не так вже й поганий, тому що час (на горизонтальній осі, на який посилаються лінії) є безперервним. Значення рядка, на мою думку, не стільки в тому, що в кожен час дня ви їли певну кількість пончиків, а в тому, що кількість пончиків в день змінюється певним чином. Таким чином, ми можемо додати щось подібне до легшого більш гладкого, і це мало б сенс. Принаймні розумно думати про пончики, з'їдені в кожну годину або навіть кожну хвилину (хоча це було б розумнішим зі змінною, де кількість за день була вищою)

Більш занепокоєння - це те, що горизонтальна вісь є дискретною (особливо, коли вона номінальна), але малюються лінії. Це справді не має сенсу. Наприклад, якщо ви дивитесь (скажімо) на% голосуючих за Обаму серед (скажімо) жителів різних регіонів США, немає сенсу проводити межу між Північним Сходом та Середнім Заходом; тим більше, що порядок областей є довільним, але зміна порядку змінила б рядки. Але я бачив такі графіки.


1
Абсолютно погоджуєтесь, що там є набагато гірші зловживання лінійними графіками. Мені подобається більш плавний підхід, оскільки він не з'єднує крапки, а значить, не передбачає даних, яких немає. Але це дійсно служить для висвітлення тривожної тенденції споживання пончиків. Дякую!
користувач1379351

3
Ви, здається, пропонуєте замінити одну змінну - споживання пончиків - іншою; а саме, щільність споживання пончиків (пончики за одиницю часу). Хоча це часто робиться - особливо в двовимірних аналізах (таких як карти густоти населення) - і може бути дуже ефективним, читачам було б добре знати, що існує різниця, і розглянути, як це може відрізняти розкриваються графічно.
whuber

2
@whuber Це справедливий момент; лінія, здається, робить цю заміну. Графік, який не робить цю заміну, може бути просто крапками, не пов'язаними між собою, але це, мабуть, натякає на те, що споживання пончиків знаходиться в певній точці. Таким чином, ми можемо візуалізувати час як безперервний і поставити крапку в той момент, коли пончик вживається.
Пітер Флом - Відновіть Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.