Сучасне потокове навчання


25

Останнім часом я працюю з великими наборами даних і знайшов чимало паперів потокових методів. Назвати декілька:

Однак мені не вдалося знайти жодної документації щодо їх порівняння. Кожна прочитана стаття, здається, проводить експерименти на різних наборах даних.

Я знаю про sofia-ml, vowpal wabbit, але вони, здається, реалізують дуже мало методів, порівняно з величезною кількістю існуючих методів!

Хіба менш поширені алгоритми недостатньо ефективні? Чи є якась стаття, яка намагається переглянути якомога більше методів?


7
Якщо цього немає, то напишіть це самі :)
Кріс К

1
ви розумієте, що людям в академічних школах доводиться писати документи / придумувати нові алгоритми, і вони шукатимуть набори даних, на яких найкраще працює їх алгоритм. Я рекомендую вам просто переконатися, що ви розумієте, як працює одна бібліотека, наприклад vowpal-wabbit (тобто всі параметри тощо).
seanv507

1
Це насправді навпаки! Я зрозумів, що люди обрали найкращий набір даних і, як правило, відносно мовчать про те, як вони перехрещували алгоритми (як їхні, так і конкуруючі методи). Я радше шукаю потокову версію jmlr.org/papers/volume15/delgado14a/delgado14a.pdf
RUser4512

1
Дійсно як папір JMLR, яку ви зв'язали. Я сам не знаю подібного порівняння для потокових алгоритмів. Можливо, тому, що потокова передача є більш нішевою, а також тому, що порівняти класифікатори для статичних наборів даних вже важко, але зробити складне порівняння для потокової передачі даних ще складніше.
статистика0007

1
Хоча вони конкретно не відповідають на ваше запитання, два пов'язані з цим ресурси: Оцінка алгоритмів, що вивчаються з потоків даних Гами та ін., В яких обговорюються методи оцінки, та МОА (Massive Online Analysis) , відкрита рамка для видобутку потоку даних, яка включає можливість оцінювати результативність.
користувач77876

Відповіді:


1

Ретельне опитування декількох алгоритмів, схожих на папір Delgado, з якою ви пов’язані, є недоступною, наскільки я знаю, але були зроблені зусилля для збору результатів для сімей алгоритмів.

Ось деякі джерела, які мені здаються корисними (відмова від відповідальності: я публікую в цьому районі, тому, ймовірно, я упереджений у виборі):

Деякі пакети програмного забезпечення:

Я можу додати більше інформації та джерел, якщо потрібно. Як зазначають інші, поле може використовувати комплексне опитування.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.