Які альтернативи зламаним осям?


28

Користувачі часто спокушаються розбити значення осі, щоб представити дані різних порядків на одному графіку (див. Тут ). Хоча це може бути зручно, це не завжди кращий спосіб відображення даних (може бути в омані в кращому випадку). Які альтернативні способи відображення даних, які відрізняються за кількома порядками?

Я можу придумати два способи - ввімкнути перетворення даних або використовувати гратчасті графіки. Які ще варіанти?


1
Ці посібники Excel виглядають досить моторошно ...

5
Чи можете ви уявити, як підручник з R виглядає на людину, яка ніколи в житті не бачила рядки коду? :)
Роман Луштрик

3
Гаразд, але я також можу уявити всіх людей, які малюють вручну десятки перерв бар в Excel і вважають, що це єдиний (і, отже, найпростіший і найшвидший) спосіб зробити це. Або люди витрачають години, намагаючись уніфікувати форматування у великому документі Word.

1
"Отче, прости їх, бо вони не знають, що роблять". приходить на думку. :)
Роман Луштрик

3
Офіційна група stats.stackexchange.com: The Broken Axes.
Метт Паркер

Відповіді:


17

Я дуже насторожено використовую логарифмічні осі на гістограмах . Проблема полягає в тому, що ви повинні вибрати початкову точку осі, і це майже завжди довільно. Ви можете зробити так, щоб два бруски мали дуже різну висоту або майже однакову висоту, просто змінивши мінімальне значення на осі. Ці три графіки наводять однакові дані: alt текст

Альтернативою розривним осям, про які ще ніхто не згадував, є просто показати таблицю значень. У багатьох випадках таблиці легше зрозуміти, ніж графіки.


3
Ці графіки виглядають дуже оманливими ще й тому, що у вас немає смужок помилок. Якщо додати смужки помилок, різниця буде виглядати менш суттєвою. Або ви можете використовувати сюжети, які в основному уникають подібних проблем.
nico

5
IMHO походження є проблемою смужкових діаграм, і не має нічого спільного з логарифмом. Ви можете досягти такого ж обманливого враження за допомогою лінійних осей.
cbeleites підтримує Моніку

@cbeleites. Так, ви можете створити оманливі діаграми з лінійною віссю, змінивши базову лінію. Але при лінійній осі природна базова лінія дорівнює нулю. З логарифмічними осями в більшості контекстів немає природної базової лінії.
Харві Мотульський

@HarveyMotulsky: Я прошу не погодитися. Існує цілий клас даних, який добре описаний осями журналу, і який має природну базову лінію: мультиплікативні зміни / співвідношення. У вашому прикладі, можливо, оброблений сигнал становить 15x керуючий сигнал. Якщо це припущення має сенс для програми, у вас є "природний" базовий рівень для журналу. Якщо ні, можливо, інша трансформація є більш розумною?
cbeleites підтримує Моніку

1
@cbeleites Я погоджуюся, що якщо змінна є співвідношенням, тож 1,0 є природною базовою лінією, то показувати її в масштабі журналу має сенс.
Харві Мотульський

11

Деякі додаткові ідеї:

(1) Вам не потрібно обмежуватися логарифмічним перетворенням. Наприклад, знайдіть на цьому веб-сайті тег "перетворення даних". Деякі дані добре піддаються певним перетворенням, як-от root або logit. (Таких перетворень - навіть журналів - зазвичай слід уникати при публікації графіки для нетехнічної аудиторії. З іншого боку, вони можуть бути чудовими інструментами для перегляду шаблонів у даних.)

(2) Ви можете запозичити стандартну картографічну техніку вставки деталей діаграми в межах або поруч із діаграмою. Зокрема, ви побудували б самі крайні значення на одній діаграмі, а всі (або) інші дані на іншій з більш обмеженим діапазоном осей, а потім графічно розташувати два разом із вказівками (візуальними та / або записаними) відносин між ними. Придумайте карту США, в якій Аляска та Гаваї розміщені в різних масштабах. (Це не працюватиме з усіма видами діаграм, але може бути ефективним з діаграмами на вашій ілюстрації.) [Я бачу, це схоже на нещодавню відповідь mbq.]

(3) Ви можете показати розбитий сюжет поруч із тим самим сюжетом на нерозривних осях.

(4) У випадку прикладу вашої діаграми виберіть відповідну (можливо, сильно розтягнуту) вертикальну вісь та надайте утиліту панорамування. [Це скоріше хитрість, ніж справді корисна методика, IMHO, але вона може бути корисною в деяких особливих випадках.]

(5) Виберіть іншу схему для відображення даних. Замість штрихової діаграми, яка використовує довжину для відображення значень, виберіть діаграму, в якій області символів представляють значення, наприклад. [Очевидно, тут брали участь компроміси.]

Ваш вибір техніки, ймовірно, залежатиме від мети сюжету: сюжети, створені для дослідження даних, часто відрізняються від сюжетів, наприклад, для загальної аудиторії.


8

Можливо, це можна віднести до решітки, але я спробую; накресліть всі бруски, які масштабуються до найвищої на одній панелі, і поставте іншу панель, що показує масштаб на нижчих. Я використовував цю техніку один раз на випадок розкидання, і результат був досить приємним.


8

Я б відокремив проблему осей журналу від проблеми штрихових діаграм.

Логарифмічні осі ІМХО найкраще підходять для речей, які надходять або трапляються у кратних розмірах (... збільшуються в 20 разів при обробці за допомогою ...).
У цьому випадку природне походження 1 = 10⁰. Існує цілий спектр фізичних / хімічних значень, які насправді є логарифмічними, наприклад, pH або поглинання і мають "природне" походження. Для A це було б . Для рН у водних розчинах, наприклад 7.I 0A=lgI0lgII0

Штрихові діаграми ніколи не можуть бути розумними, якщо немає розумного та фіксованого походження, яке бере роль контролю (базовий рівень, порожній). Але це не має нічого спільного з осями колоди.
Єдине регулярне використання для гістограми - це гістограми. Але я міг би уявити, що вони добре показують різницю в цьому походженні (ви також відразу бачите, різниця позитивна чи негативна). Оскільки бруски зображують область, я схильний вважати барчарти як дуже дискретні версії площі під кривою. Тобто вісь x повинна мати метричне значення (що може бути з часом, але не з містами).

Якби мені було цікаво, яке походження використовувати для журналу чогось, що мало "природне" походження на 0, я б відступив і подумав трохи про те, що відбувається. Дуже часто такі проблеми є лише показником того, що журнал тут не є розумним перетворенням.

Тепер гістограма з осями колоди підкреслює збільшення чи зменшення, що відбувається в кратних розмірах. Розумні приклади, про які я зараз думаю, усі мають деяке лінійне відношення до величини, що цікавить. Але, можливо, хтось інший знайде хороший приклад.

Тому я думаю, що перетворення даних повинно бути розумним щодо значення даних. Це стосується фізико-хімічних одиниць, про які я згадував вище (A пропорційний концентраціям, а pH має, наприклад, лінійне відношення до напруги в pH-метрі). Насправді так настільки, що блок журналу отримує нову назву та використовується лінійним способом.

І останнє, але не менш важливе, я походить від вібраційної спектроскопії, де досить регулярно використовуються зламані осі. І я вважаю це використання одним із небагатьох прикладів, коли зламання осей не обманює. Однак у нас немає змін у порядку величини. У нас просто є неінформативна область 30 - 40% нашого діапазону x: Ось приклад: спектр для цього зразка частина між 1800 - 2800 / см не може містити корисної інформації.
Таким чином, видаляється неінформативний спектральний діапазон (що також вказує на спектральні діапазони, які ми фактично використовуємо для хіміометричного моделювання): видалено неінформативну частину спектру

Але для інтерпретації даних нам потрібні точні показання позиції x. Але загалом нам не потрібні кратні, що охоплюють різні діапазони (тобто є такі відносини, але більшість з'єднань є складнішими. Наприклад: Сигнал у 3050 / см, тому у нас є ненасичена або ароматична речовина. Але немає сильного сигналу в 1000 / см , тож жодне моно-мета, ні 1,3,5 -заміщене ароматичне кільце ...)
Отже, краще зобразити х з більшим масштабом (насправді ми часто використовуємо міліметрові аркуші, як напрямні, або маркуємо точні місця). Отже, ми порушуємо вісь і отримуємо більший х масштаб: спектр - зламана вісь

Насправді це дуже схоже на фацетування: фацетна версія
але зламана вісь IMHO підкреслює, що масштаб осі x в обох частинах однаковий. Тобто інтервали в межах графіків однакові.

Щоб підкреслити малі інтенсивності (вісь y), ми використовуємо збільшені вставки:
введіть тут опис зображення
[ ... Детальніше див. Збільшений (x 20) νCH область синього кольору. ]

І це, безумовно, можливо і на прикладі на пов'язаних сюжетах.


2

Дві ідеї, на які було нагадано, але не було чітко описано, коли я дивився на відмінні відповіді та зауваження, полягав у тому, що ви використовуєте панельну діаграму "таким чином, що не відповідає маркування" та нормалізованим / безрозмірним даним.

Тип ділянки:

Діаграма в стилі зірки / павука / радара (посилання) (посилання) часто дуже хороша для порівняння декількох різних речей за кількома координатами. Існує ряд дуже корисних сюжетів, які (на жаль) є рідкісними в бізнес-презентаціях, ймовірно, тому що керівництво вважає за краще використовувати висновки для прийняття рішень, а не використовувати інформацію для розуміння, а потім використовувати розуміння для прийняття рішень. У бізнесі іноді дуже важко досягти консенсусу, тому підхід, що стосується лише результатів, може мати більший врожай в умовах консенсусу - перше, наступне рішення. Це інформує про популярність діаграми смуги / стовпців. Розгляньте приклади інших типів графіків, які корисні для розуміння (посилання) .

Трансформація:

Якщо ви розділите значення, які ви накреслюєте, на "характерне" значення, то ви можете перетворити масштабування для поліпшення читабельності без втрати інформації. Флюїдні динаміки віддають перевагу безрозмірних чисел через їх передбачуваність та еластичність у застосуванні. Вони розглядають такі речі, як теорема Бакінгем-Пі, як джерела для кандидатських безрозмірних форм (посилання) . До популярних і корисних безрозмірних чисел належать число Рейнольдса, номер Маха, номер Біота, номер Грасхофа, Пі, номер Релі, номер Стокса та номер Шервуда. (посилання) Вам не потрібно бути фізиком, щоб любити безрозмірні числа, оскільки вони корисні в нефізичних програмах. Такі заходи, як щільність, однорідність, кругова та копланарність, можуть визначати зображення, піксельні поля або багатовимірний розподіл ймовірностей. Не варто розглядати лише логарифм чи відносну відстань від відомої величини - ви також можете розглянути інвертування чисел, взявши їх квадратні корені.

Удачі. Будь ласка, повідомте нам, як все виходить.


1
Більшість органів влади, зокрема, категорично проти використання радарів. Їх важко інтерпретувати. Набагато кращою альтернативою є паралельна діаграма координат .
Джон Пельтьє

@JonPeltier - Я погоджуюсь, але Excel (тоді, коли я відповів) не мав чіткого способу скласти паралельну координатну діаграму, тому, швидше за все, його аудиторія буде намагатися зрозуміти.
EngrStudent

1

Рішення зламаної осі найкраще працює, коли є чіткий розрив праворуч по ділянці, а ординати позначені так, щоб зазор був очевидним. Перевагою цього є те, що шкала зберігається через два набори значень. Діаграми на панелі з різними масштабами можуть не передавати відносної зміни в межах низької та високої груп. Мені подобається ідея масштабування, яку я запрограмував на розсіювачі, але не думав використовувати для штрихових сюжетів.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.