Хтось знає хороше програмне забезпечення з відкритим кодом для візуалізації даних із бази даних?


50

Нещодавно я натрапив на Tableau і спробував візуалізувати дані з бази даних та CSV-файлу. Користувальницький інтерфейс дозволяє користувачеві візуалізувати часові та просторові дані та створювати графіки за мить. Такий інструмент дійсно корисний, оскільки дозволяє графічно спостерігати за даними, не записуючи код.

Оскільки є багато джерел даних, з яких мені доводиться отримувати та візуалізувати дані, було б дуже корисно мати інструмент, який дозволить генерувати діаграми, просто перетягуючи стовпці по осях та додатково змінюючи візуалізацію, перетягуючи імена стовпців.

Хтось знає будь-яке програмне забезпечення вільного або відкритого коду такого типу?


1
Під базою даних ви маєте на увазі структури SQL, Postgres, Монго? ( Індукція для Mac має такі функціональні можливості.) Або ви після будь-якої програми, яка приймає файли CSV і дозволяє перетягувати стовпчики на графічні шаблони, або à la GGobi ?
chl

Я створив інструмент для плоттера github.com/burlachenkok/plotter_plusplus
bruziuz

Відповіді:


38

Я ніколи не пробував цього, але є набір для візуалізації на основі робочого столу / браузера з відкритим кодом, який називається WEAVE (скорочено для веб-середовища аналізу та візуалізації). Як і Tableau, він призначений для вивчення даних через інтерактивний інтерфейс на основі кліку. На відміну від Tableau, це відкритий код: ви можете завантажити вихідний код і встановити свою власну версію на власній машині, яка може бути настільки ж приватною або такою ж публічною, як ви хочете. Не чекайте нічого майже такого стрункого та зручного в користуванні, як Tableau, але це виглядає як цікавий, потужний проект для того, хто готовий вкласти час на те, щоб навчитися ним користуватися.

введіть тут опис зображення введіть тут опис зображення введіть тут опис зображення


Або ви можете заглянути в прокат самостійно . Існує кілька дійсно хороших інструментів Java-скрипта з відкритим кодом для підтримки візуалізації даних програмування у браузері. Якщо ви не заперечуєте проти кодування Javascript і якогось шару на серверному сервері для обслуговування даних, спробуйте:

  • Набір даних Miso для отримання, обробки, управління та очищення даних на стороні клієнта в Javascript (включає CSV-аналізатор)
  • D3 для інтерактивної візуалізації у SVG (працює у будь-якому браузері, окрім IE8 та попередніх та старих (v1, v2) телефонів Android).
  • gRaphael для інтерактивних стандартних схем крос-браузера
  • Рафаель, якщо вам потрібен вихід SVG для роботи в Internet Explorer 6, 7 та 8.

Якщо вас цікавить варіант веб-програмування, ось дещо докладніший запис, який я написав на Raphael і D3 для stackoverflow .


Також є кілька безкоштовних (не з відкритим кодом) онлайн- наборів данихvis, які варто згадати (напевно, не підходять для прямого підключення до БД, але варто переглянути):

  • Raw by Density Design - вступ в блог - (натисніть "Вибрати зразок даних", щоб випробувати його) - переважно копіюйте та вставляйте на основі, не впевнені, чи є у нього API, який може підключитися до бази даних, але добре для того, щоб швидко випробувати речі.
  • Tableau Public - безкоштовна у користуванні інтернет-версія Tableau. Суть полягає в тому, що дані, які ви вводите в неї, і будь-які створені вами візуалізації повинні бути загальнодоступними.

І щось зовсім інше: якщо у вас лежить якісний сервер, і вам трапляється, що ви хочете зробити приголомшливі "ковзаючі" карти в стилі google-maps, використовуючи технологію з відкритим кодом (можливо, не те, що ви шукаєте - але це можливо! ), перевірити MapBox TileMill . Подивіться галерею прикладів на їх домашній сторінці - деякі з них справді приголомшливі. Дивіться також пов'язаний проект Modest Maps , бібліотеку Javascript з відкритим кодом для взаємодії з картами, розроблену компанією Stamen Design (дійсно високо оцінене агентство, що спеціалізується на інтерактивних картах). Це вважається вдосконаленням на більш створених OpenLayers. Усі з відкритим кодом.

введіть тут опис зображення


WEAVE - найкращий інструмент з відкритим кодом, заснований на графічному інтерфейсі, про який я знаю для особистого візуального аналізу .

Інші перераховані інструменти - це вершина інструментів для опублікування візуалізацій в Інтернеті (наприклад, D3 використовується та розробляється нагородами графічною командою NY Times ), і вони частіше використовуються для візуалізації в контексті публічної діяльності комунікації, ніж дослідний аналіз, але їх можна використовувати і для аналізу.


7

Інтерфейси вказування та натискання здаються простішими, але з часом ви будете корисні, навчившись "писати код".

Однією з переваг систем, що базуються на сценаріях, є інтерфейс точок, клацання та перетягування - це аудиторський слід / історія (деякі графічні інтерфейси мають історію, але працювати з ними, як правило, не так просто). Якщо ви пишете якийсь код, щоб створити свій графік і зберегти його, то його завжди легко повторити або зробити невеликі зміни, а потім повторити, не завжди легко запам'ятати набір кліків і перетяжок, що використовуються для створення попереднього графіка.

Сценарії також будуть набагато швидшими для великої кількості сюжетів. Написання коду для першого сюжету знадобиться трохи більше часу, але додавання лише декількох рядків та деяких невеликих модифікацій дозволяє переглядати 100 або більше змінних з невеликими додатковими зусиллями, коли потрібно зробити той самий набір кліків і тягнеться знову і знову для кожного сюжету.

У багатьох інструментах побудови графіків на основі сценаріїв є графічні інтерфейси, які дозволяють використовувати точку та клацання, щоб розпочати роботу, але допоможуть вам вивчити код та перейти до більш потужних методів.

Я рекомендую R, який є безкоштовним та відкритим кодом та має деякі графічні інтерфейси (Rcmdr, jgr, rstudio тощо) як хороший варіант.


4
Хоча інструменти, засновані на сценаріях, допоможуть вам генерувати одну і ту ж діаграму неодноразово з різними джерелами даних, інтерактивні інструменти набагато краще для вивчення та виявлення в новому наборі даних. Задавши питання, ви просто натискаєте кнопку чи дві, щоб змінити вісь, кольорові шкали, кластеризацію тощо, а не писати код, щоб це зробити. Це набагато нижча вартість, і скасування стеку або перегляд історії дослідження дозволить вам відслідковувати, якщо ви помиляєтесь.
edallme

1
@edallme, я не згоден. Те, що ви говорите, може бути правдою для людей, які знають основи інтерфейсу графічного інтерфейсу і не знають сценаріїв інструментів, але я думаю, що це аргумент для вивчення інструментів сценаріїв. У моєму випадку я очікую, що натискання стрілки вгору, лівої стрілки та введення чогось типу "col.axis = 'blue" "займе менше часу, ніж переміщення моєї руки мишею, натискання на сюжет та пошук параметрів . Для тих, хто починає графічний інтерфейс, можна відчути, що можна змінити, але я віддаю перевагу тим, хто показує код, щоб вони засвоїли кращий підхід.
Грег Сніг

1
Мені подобається підхід програми «Графічний інтерфейс» до вибору параметрів, а потім виплюнення коду, який ви можете повторно використовувати, натиснувши «Добре». Корисно мати сценарії, коли вам потрібно автоматизувати речі. Але пошуковий пошук - це набагато більше, ніж зміна параметрів діаграми один чи два рази. У хороших інтерактивних інструментах користувачі можуть змінювати стовпці, які використовуються для діаграми, одним натисканням кнопки або клавіші зі стрілкою, фільтрувати до підмножини даних за допомогою повзунка або взаємодії перетягування та перемикання між діаграмами, що показують підключені точки даних . Більше того, кожна зміна надається менше ніж 100 мс і не карає користувачів.
edallme

1
Варто додати, що сьогодні є пакети R, що значно спрощує веб-додаток. Дивіться блискучий або opencpu
jangorecki

@GregSnow: це дійсно залежить від пакету візуалізації. Я можу отримати дійсно приємний, детальний сюжет з фасетами та всім тим джазом, який працює в ggplot набагато швидше, ніж я міг би з будь-яким графічним інтерфейсом. Те саме не можна сказати для matplotlib, базових сюжетів R та багатьох інших пакетів.
naught101

3

RapidMiner має хороші візуалізації:

http://rapid-i.com/component/option,com_myblog/show,New-Plotters-for-RapidMiner.html/Itemid,172/lang,en/

І звичайно, є R + ggplot2, використовуючи веб-інтерфейс або графічний інтерфейс:

http://labs.dataspora.com/ggplot2/

http://www.deducer.org/pmwiki/index.php?n=Main.PlotBuilder


R + Mondrian або ggobi також приємно
wdkrnls

1

Ви можете скористатися безкоштовним хмарним сервісом за адресою https://my.infocaptor.com/free_data_visualization.php

Онлайн-версія дозволяє завантажувати будь-які дані csv / excel та швидко їх візуалізувати. Для цього вам не потрібен логін. Якщо ви хочете працювати з базами даних, вам потрібно буде увійти або завантажити програмне забезпечення.

PS: Я є частиною компанії, яка виробляє цей продукт


Ласкаво просимо на наш сайт. Це трохи рідко, ви можете додати більше? Крім того, я вважаю, що це ваша власна послуга, тому вам слід згадати про це (але я думаю, що це нормально, коли це розміщувати тут, якщо це безкоштовно і ви про це відкрите).
gung - Відновіть Моніку


1

Існує новий інструмент під назвою Helical Insight, який є інструментом BI з відкритим кодом, за допомогою якого ви можете створювати діаграми, звіти, інформаційні панелі та різні візуалізації даних. Використовуючи це, ви можете створювати звіти двома способами: BI самообслуговування та Миттєвий BI. У BI-службі самообслуговування ви перетягуєте n потрібних стовпців, які ви хочете, додаєте фільтри, щоб в кінцевому підсумку створити уявлення. "Миттєвий BI" - це функція, за допомогою якої ви можете набрати будь-яке бізнес-питання та отримати відповідну інформацію відповідно. Що стосується візуалізації даних, то ви можете мати вбудовані прості діаграми, наукові діаграми, а також дуже вбудовувати в неї власну діаграму. Відвідайте www.helicalinsight.com


1

На це питання, Orange, правильна відповідь . У той час, коли питання було розміщено, це вже було близько 2-го випуску. У системах Linux на основі його можна просто встановити з допомогою індексу Python пакета з , pip install orange3і це також в Arch User Repository для Arch Linux, Manjaro, сигналізації та інших Arch на основі дистрибутивів.

Крім того, на StackExchange є практично те саме питання, в якому згадуються ще кілька комерційних / веб-альтернатив (яке закрите і посилається тут). Ще декілька можна знайти на Quora , але Orange - це єдиний з відкритим кодом, складений та має графічний інтерфейс одразу, про який я знаю. На мій погляд, він має досить досконалий, естетичний та мінімалістичний інтерфейс.


0

Можливо, http://www-958.ibm.com/software/data/cognos/manyeyes/ - це те, що ти хочеш. Остерігайтеся, що дані, які ви завантажуєте, є загальнодоступними. Редагувати: Вибачте, я бачу, що ви попросили відкритого коду. Моє ліжко.


0

Існує також молода програма для (автоматизованого) зчитування, фільтрування, обробки, інтерполяції та графіки n-мірних значень з різних джерел (наприклад, файлів libreOffice- або csv) та змінного розміру: diaGrabber .

Вам потрібно використовувати кілька простих команд python для створення справи. Після цього ви можете маніпулювати графічним результатом в інтерактивному графічному інтерфейсі .

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.