Ресурси для навчання створення візуалізації даних?


19

Мені цікаво дізнатися, як створити тип візуалізацій, які ви бачите на http://flowingdata.com та informationisbeautiful. EDIT: Значення, цікаві самі по собі візуалізації - начебто на зразок графіки NY Times, на відміну від швидкої інформації для звіту.

Які інструменти використовуються для їх створення - це в основному багато Adobe Illustrator / Photoshop? Які хороші ресурси (книги, веб-сайти тощо), щоб навчитися використовувати ці інструменти зокрема для візуалізації даних?

Я знаю, як я хочу виглядати візуалізаціям (і я знайомий з принципами дизайну, наприклад, з книг Tufte), але я не знаю, як їх створити.

Відповіді:


20

Поточні дані регулярно обговорюють інструменти, які він використовує. Дивіться, наприклад:

Він також дуже докладно показує, як він створює графіку при нагоді, наприклад:

На цьому сайті також є інші питання:

ІМО, спробуйте:

  1. R і ggplot2: це хороше вступне відео , але на сайті ggplot2 є багато ресурсів.
  2. Обробка: багато хороших навчальних посібників на домашній сторінці .
  3. Протовіс: також безліч чудових прикладів на домашній сторінці .

Ви можете використовувати Adobe після цього, щоб очистити їх.

Ви також можете подивитися на webvisпакет R , хоча він не такий повний, як ggplot2. З R ви можете виконати цю команду, щоб побачити приклад пшениці Playfair:

install.packages("webvis")
library(webvis)
demo("playfairs.wheat")

І нарешті, мої улюблені комерційні програми для інтерактивної візуалізації:


1
Дивовижні, чудові посилання! Я вже використовую R та ggplot2, але візуалізації звідси здаються більше "графікою для звіту" -різноманітністю, ніж "очною цукеркою / візуалізацією, цікавою для себе" - різноманітністю, яку я шукаю. (ggplot2 - це надзвичайно красиво, але насправді це не означає, щоб дозволити необмежену творчість.) Я помиляюся ?, чи іноді ви використовуєте R / ggplot2 як вхід до іншого інструмента візуалізації?
raegtin

5

Вже згадана обробка має приємний набір книг. Див .: 1 , 2 , 3 , 4 , 5 , 6 , 7

Ви знайдете в Інтернеті багато матеріалів, які допоможуть вам почати з R. Як наступний крок, тоді ggplot2 має чудову веб- документацію . Я також знайшов книгу Хедлі дуже корисною.

Пітон може бути іншим шляхом. Особливо з такими інструментами, як:

Усі проекти добре задокументовані в Інтернеті. Ви також можете заглянути в деякі книги .

Нарешті, книга « Графіка великих наборів даних» також може допомогти.


igraphпрацює і в R; для прискореного 3D openGL в R, використанні rglта misc3dпакетах.

Також matplotlibсюжети некрасиві; вони можуть бути приємними для довголітніх користувачів gnuplot.

2

Ви витратите багато часу на швидкість з Р.

RapidMiner є безкоштовним та відкритим кодом та графікою, має багато хороших візуалізацій, і ви можете їх експортувати.

Якщо у вас є гроші на запчастини, або ви співробітники університету / студенти, JMP також дуже приємно. Це може зробити дуже гарні графіки, дуже-дуже легко. Можна експортувати у флеш або PNG або PDF або що у вас є.


5
1. Час IMHO, проведений з R, добре вкладається, якщо ви плануєте зробити щось серйозне. 2. Також розглядайте KNIME knime.org як альтернативу RapidMiner.
radek

(+1) @radek. Я також є фанатом швидкого руху, але, на мій погляд, він недостатньо гнучкий для складних візуалізацій.
steffen

Якщо у вас є досвід кодування, то вам дійсно не знадобиться більше дня або близько того, щоб досягти швидкості з R. Це досить прямо вперед, що стосується мов, і є кілька чудових онлайн-підручників.
naught101

1

Ще однією хорошою альтернативою є протовісна бібліотека http://vis.stanford.edu/protovis/

Це дуже добре створена бібліотека JavaScript, яка може створити гарні візуалізації, якщо у вас є час і можливість написати скромну кількість необхідного коду JavaScript.

Я також дуже рекомендую Tableau http://www.tableausoftware.com . Він чудово підходить для швидкого вивчення наборів даних та створення безлічі різних візуалізацій.

Обидві продукти мають коріння у Stanford Group Visualization Group.


1

Тут було дано багато відмінних відповідей, і мови / бібліотеки, які ви вирішите вивчити, залежатимуть від типу візуалізації, яку ви хочете зробити.

Однак якщо ви регулярно використовуєте Python, я дуже рекомендую вроджених . Це дуже складно, якщо мова йде про візуалізацію статистичних даних, але також виглядає досить витончено з точки зору презентації.

Візьмемо приклад. Припустимо, ви намагаєтеся планувати споживання електроенергії для комерційної будівлі по місяцях. Для цієї мети в matplotlib може бути сформований простий лінійний графік.

Однак, якби ми хотіли зробити візуалізацію більш витонченою та інформативною, ми могли б створити теплову карту з новонародженими:

теплова карта

Теплова карта - лише один із прикладів. Деякі інші поширені випадки використання з новонародженими:

  • Діаграми KDE
  • Ройові сюжети
  • Скрипкові сюжети

Ідея, що стоїть за морем, полягає в тому, щоб представити дані більш інтуїтивно, ніж це було б можливо за допомогою більш простих діаграм, наприклад, лінії, смуги, пирога тощо.

Якщо вас це цікавить - більше інформації про моренародження ви можете знайти тут: https://seaborn.pydata.org/



0

R - це чудово, але це не так, що R важко засвоїти, це те, що в документації неможливо шукати будь-яке інше ім'я, як Rq було б чудово. Тож, коли у вас виникли проблеми, пошук рішення - це кошмар, і документація теж не велика. Matlab або Octave будуть чудовими. І отримати ці сюжети в R або Matlab було б дуже нудно.

ІМХО післяобробка візуальних зображень - найкращий шлях. Чимало їх із потокових даних передаються через Adobe Illustrator або Gimp. Це швидше. Як тільки ви отримаєте структуру сюжету, потім змініть деталі в редакторі. Використання R як редактора не дає вам потрібної гнучкості. Ви постійно будете шукати нові пакети.


R; function??- R має вбудовану допомогу. Ви також можете зазвичай шукати "кран", щоб знайти R речі, і я вважаю, що більшість основних пошукових систем можуть досить добре обробляти одну букву.
naught101

0

Ось підручник YouTube на D3.js, який викладає основи HTML, SVG, CSS та JavaScript, а також як завантажувати дані та створювати смугову діаграму, лінійну діаграму та розповсюджувати графік за допомогою D3.js.

Ескіз відео



-3

Є нескінченні ресурси, але ви можете їх звузити, виходячи з того, як ви хочете трансформувати ваші дані, скільки джерел даних, з якими ви маєте справу, як їх потрібно ділитися тощо.

Ось посібник про те, як вибрати потрібний ресурс, який може допомогти вказувати вас у правильному напрямку.


1
Коли ви пов’язані з цією групою, будь ласка, заявіть про зацікавлення. Відповіді лише на посилання не є найбільш корисними. Поради щодо сайту stats.stackexchange.com/help/promotion можуть застосовуватися.
Нік Кокс
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.