Найкращий спосіб візуалізації виснаження за допомогою R?


15

Через цей сайт я нещодавно відкрив діаграми Sankey - прекрасний спосіб візуалізації того, що відбувається в традиційній схемі потоків.

Ось хороший приклад діаграми Санкі Джорджа М. Уайтсайдса та Джорджа В. Кребтрі , Не забувайте про довгострокові фундаментальні дослідження в галузі енергетики Джерело; Не забувайте про довгострокові фундаментальні дослідження в галузі енергетики , наука 9 лютого 2007: Вип. 315. ні. 5813, с. 796 - 798.

Після того, як я зрозумів, що не існує пакета Sankey R, я знайшов сценарій R в Інтернеті , на жаль, цей сценарій є досить сирим і дещо обмеженим. З великими надіями я попросив R-пакет Sankey або більш зрілу функцію в stackoverflow , але, на мій подив, здається, що у нас немає зрілої функції для побудови діаграм Sankey в Р.

Після того, як я опублікував щедрий Geek On Acid, був досить люб’язний, щоб запропонувати невеликий злом існуючого сценарію, який змусив його працювати більш-менш для моєї конкретної мети.

Удосконалений R-скрипт створив цю діаграму, Діаграма на діаграмі R-Sankey кислотної кислоти Джерело; stackoverflow.com .

Але, чи не вистачає пакету R вказує на те, що діаграми Sankey не є таким дивовижним способом візуалізації виснаження за допомогою R у потоці даних a la the, представленому на діаграмі вище (див. Початкове запитання про stackoverflow щодо даних та коду R. Можливо є кращий спосіб візуалізації виснаження.

Як ви вважаєте, що найкращий спосіб візуалізувати виснаження в потоці даних за допомогою R?


7
Це дуже важко отримати діаграму добре виглядати в будь-якому автоматичному режимі (перший приклад був , ймовірно , зроблений художником вручну розміщення вузлів). Важка програма не має нічого спільного з її корисністю як графічного інструменту. На цій моїй посаді ви можете знайти більше мотивації щодо візуалізації потоків. Також я наводжу кілька прикладів парцетів та крапкових сюжетів у відповідь на цей сайт.
Енді Ш

@AndyW, дякую за дуже корисний коментар. Я вивчу різні методи та експериментуватиму зі своїми даними. Спасибі.
Ерік Файл

Ця верхня діаграма є чудовою ідеєю, але мені здається, що сума джерел не дорівнює
сумірі

Ах .. неважливо, я неправильно прочитав ... легші біти на джерелах - це лише мітки, а не частина даних. Трохи заплутано ..
naught101

Відповіді:


4

Я згоден з @gung. Діаграма Санкі, яку ви опублікували, я думаю, досить гарний приклад того, де методика може допомогти. Хоча це і складно, контекст (введення та виведення енергії) теж складний, і важко придумати приємніший спосіб візуалізації шляхів введення-виведення-діючих як нових-входів для різних категорій використання.

Тепер для прикладу виснаження, який ви опублікували, як інші відмітили, не корисно використовувати діаграму Sankey. Я думаю, вам потрібно опублікувати повний набір змінних, якщо ви хочете отримати хорошу рекомендацію щодо альтернативних візуалізацій. Якщо ви просто хочете показати відмінності у джерелах виснаження між сайтами та лікарями, то для вашої аудиторії може бути найпростішим для розуміння аудиторією та для вас реалізацією невеликі кратні серії сюжетних точок ( див. Цей приклад , де у вашому випадку групи можуть бути сайти, елементи всередині груп були б причинами стирання, а горизонтальна вісь становила б 0-100%).

Якщо діаграма Sankey - це те, що ви хочете використовувати, і ви готові посперечатися на іншій мові високого рівня, в галереї є хороший приклад (з кодом) для пакету графіків Python, matplotlib.


3

Я б не обов'язково припускав, що відсутність методу означає, що метод є неважливим або не корисним. Зрештою, для всіх методів, які зараз існують в R, був час (цілком можливо останній - R лише ~ 10 років), коли для нього не було пакету.

Однак, я думаю, існує будь-яка кількість способів візуалізації даних, таких як виснаження. Перша моя думка, дивлячись на вашу діаграму, полягає в тому, що вона може бути представлена точковим сюжетом . Існують і інші можливості. Додаткова функціональність діаграми Sankey ввійде в дію, коли у вас є певне погіршення через певну причину в один момент, а потім більше через ту саму причину пізніше, коли інші входи та виходи між ними. Це було б складніше представити стандартними сюжетами (також важче дотримуватися навіть за діаграмою Санкі - наприклад, той, що знаходиться вгорі сторінки, потребує читання). Оскільки у вас, здається, цього немає, діаграма Санкі, здається, досить, але надмірна.


1
Перша графіка - дивовижний ІМО. У ньому є багато деталей, які важко було б настільки інтуїтивно зафіксувати у серії крапок. Крім того , схема Сенк добре візуалізувати потоки від і до різних вузлів (повторне об'єднання в використану енергію і втрачену енергію).
Енді Ш

@AndyW, я не хочу збити цю цифру. Це чимало роботи, щоб читати в основному б / с, вона містить багато інформації. Те, що притягує вас і тримає вас там на деякий час, може бути справжнім плюсом - я не мав на увазі, що мій опис не сприймається як негативний. ОТО, дані ОП досить прості, що простіші сюжети могли передати їх.
gung - Відновити Моніку

Хороший момент, якщо дані ОП не складніші, ніж дані, це, мабуть, більше проблем, ніж варто! Я б навіть не хотів думати про перетворення початкової енергетичної діаграми на ряд точкових графіків.
Енді Ш

@gung, Дякую за відповідь на мій пост. Я погоджуюся, відсутність методу не слід сприймати як остаточний ознака того, що метод не є корисним чи корисним, і я точно не дав оп діаграми Санкі (SD). Що стосується моїх даних, то, що ви бачите на діаграмі, є лише верхнім виміром моїх даних, я маю дані, зібрані на 4 різних сайтах та 7 різних клініцистів, і я хотів би включити цю інформацію до мого сюжету, як-от якийсь розподілити в межах загального потоку. Це може виглядати як перевищення поточних даних, але я вважаю, що SD буде корисним, якщо я включаю всі мої змінні.
Ерік Файл

З / більшою складністю, схема Sankey, мабуть, найкраща для вас. Варто також витратити час на перегляд деяких публікацій @ AndyW, як-от пов’язаних вище. Він дав багато хороших відповідей, які можуть бути актуальними. Наприклад, якщо натиснути на його ім’я, щоб перейти на його сторінку, а потім натиснути на тег візуалізації даних там, ви зможете переглянути його публікації.
gung - Відновіть Моніку

1

Як щодо використання коду R для написання файлу SVG із встановленою шириною стрілки відповідно до ваших даних та простою компоновкою. Потім завантажте в Inkscape і зігніть стрілки навколо, додайте мітки тощо тощо до вмісту серця, щоб зробити щось гарне.

Очевидна проблема: вам потрібно повторити всі свої попередні описи в Inkscape, якщо ваші дані зміниться (хоча ви, можливо, зможете використовувати ваш гарненький SVG з Inkscape як шаблон і просто замінити нові ширини стрілки в).

Але чесно кажучи, якщо ця різнобарвна безладність скуйовгнутих верхівків є гарною схемою Санькі, я б ненавиджу бачити поганий на повний шлунок [хоча дивлячись на це ще кілька хвилин, я дав мені підказку про про що йдеться, хороша графіка цього не потребує].


2
Мені буде цікаво побачити кращий спосіб візуалізації цих даних. У цьому сюжеті є багато інформації (і безліч різних змінних), тому, звичайно, це буде складно ...
naught101

2
Мікро карти Дана Карра потребують часу, щоб засвоїти повну графіку, як і будь-яка детальна дорожня карта. І це не обов'язково погано. Дивіться допис у блозі Джеймса Чесіра, Візуалізація швидкого мислення та повільне мислення .
Енді Ш
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.