Огляд програмних засобів для пошуку даних


15

Хоча я пройшов підготовку інженера, я вважаю, що мене все більше цікавить пошук даних. Зараз я намагаюся далі дослідити поле. Зокрема, я хотів би зрозуміти різні категорії програмних засобів, які існують та які інструменти помітні в кожній категорії та чому. (Зверніть увагу, що я не сказав "найкращі" інструменти, лише помітні, щоб ми не розпочали війну полум'я.) Особливо відзначте інструменти, які мають відкритий і вільний доступ, хоча це не означає, що це означає Мене цікавлять лише відкриті та безкоштовні.


1
Раджу це бути вікі спільноти.
Тал Галілі

звучить як домашнє завдання
Ніл МакГуйган

@Tal Безумовно, зараз перетворено.

@el шеф - Це дуже широке і загальне питання ... але я боюся, що це не домашнє завдання.
Джон Берріман

Відповіді:


7

Це, мабуть, найбільш вичерпний список, який ви знайдете: mloss.org


Однак він орієнтований на машинне навчання, яке можна розглядати як суміжне поле обміну даними, як і AI. Хоча зазвичай це використання є синонімом, оскільки "прогнозування" є однією з ключових проблем у пошуку даних. Але для видобутку даних існує більше, ніж "навчання".
Мав QUIT - Anonymous-Mousse

7

Погляньте

  • Weka (java, сильний у класифікації)
  • Помаранчевий (сценарій пітона, переважно класифікація)
  • GNU R (мова R, дещо орієнтована на векторну таблицю, див. Перегляд завдань машинного навчання та інтерфейс Rattle )
  • ELKI (java, сильний у вияві кластеризації та зовнішності, підтримка структури індексу для прискорень, список алгоритмів )
  • Mahout (Java, належить Hadoop, якщо у вас є кластер і величезні набори даних)

і сховище машинного навчання UCI для наборів даних.


1
ви можете додати Red-R до списку (вид клону помаранчевого в R): red-r.org
Amro

Я завантажив R, і зараз я граю з ним.
Джон Берріман

@Amro Дякую! Однак він не доступний на платформі Mac, якщо я не помиляюся?
chl

Я не користувач Mac, але я думаю, що збірка Linux може працювати для вас (вам потрібно вручну встановити всі залежності python): red-r.org/forum/topic.php?id=22#post-76
Amro

@Amro, я спробую; в минулому я тестував RAnalyticFlow ( j.mp/bYF8xs ), але не переконувався: я в основному користувач CLI :-)
chl


3

Погляньте на KNIME .

Дуже легко вчитися. Маючи багато можливостей для подальшого прогресу. Добре інтегрується з Векою та Р.




2

Є ELKI , проект університету з відкритим кодом, який порівняно з WEKA, але набагато сильніше, коли мова йде про кластеризацію та виявлення зовнішньої структури . WEKA насправді не є насправді майнінг даних, а програмне забезпечення машинного навчання.


1

Існує цей червоно-R , який має графічний інтерфейс і приємний візуальний інтерфейс програмування. Він використовує R для обробки різних аналізів даних.



0

SQL Server Data Mining (SSDM) не оновлювався давно, але він все ще є досить конкурентоспроможним, якщо ви видобуваєте великі реляційні бази даних та куби. Я повільно, але систематично обмірковую свій шлях через тести якомога більше інструментів майнінгу та інтерфейс Windows SQL Server - це найпродуктивніший і стабільний, який я знайшов на сьогодні (особливо, коли мова йде про корпоративні бази даних, деякі з яких дивно неохайний інтерфейс), незважаючи на свій вік. Я вважаю за краще сучасний інтерфейс Windows Presentation Foundation (WPF), але це найкраще.

Я написав цілу серію докладних навчальних посібників для любителів під назвою «Прискіплива сходи до майнінгу даних SQL Server» ще тоді, коли я намагався придбати деякі основні навички майнінгу. Незважаючи на мою недосвідченість, вони все ще корисні, щоб допомогти заздалегідь визначити деякі "готчі".

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.