Напівконтрольне навчання, активне навчання та глибоке навчання для класифікації


19

Остаточне редагування з усіма оновленими ресурсами:

Для проекту я застосовую алгоритми машинного навчання для класифікації.

Завдання: Досить обмежені марковані дані та набагато більше мічених даних.

Цілі:

  1. Застосовуйте напівнаглядову класифікацію
  2. Застосувати як-небудь напівпідконтрольний процес маркування (відомий як активне навчання)

Я знайшов багато інформації з науково-дослідних робіт, таких як застосування EM, Transductive SVM або S3VM (Semi Supervisor SVM) або якимось чином використовуючи LDA тощо. Навіть мало книжок на цю тему.

Питання: Де реалізація та практичні джерела?


Остаточне оновлення (на основі довідки, наданої mpiktas, bayer та Dikran Marsupial)

Навчальне навчання:

Активне навчання:

  • Дуаліст : реалізація активного навчання з вихідним кодом щодо класифікації тексту
  • Ця веб-сторінка дає чудовий огляд активного навчання.
  • Експериментальна майстерня дизайну: тут .

Глибоке навчання:


Існує пакет RextextTools . Якщо я не помиляюся, він реалізує кілька згаданих вами методів.
mpiktas

Привіт mpiktas, дякую за добру допомогу. Це цікавий інструментарій. Однак, схоже, це стосується лише керованого навчання, оскільки я читав "TextTools - це безкоштовний пакет з автоматичним класифікацією тексту з відкритим кодом для автоматичної класифікації тексту, який спрощує як початківцям, так і досвідченим користувачам почати роботу з контрольованим навчанням". дев'ять алгоритмів класифікації ансамблів (svm, slda, прискорення, мішковина, випадкові ліси, glmnet, дерева рішень, нейронні мережі, максимальна ентропія) "
Flake

Гаразд, ось ще одна спроба: Weka . Автори написали книгу, а її зміст згадує напівконтрольне навчання. Я щиро сподіваюся, що розділ не закінчується на "... на жаль, жоден із цих алгоритмів не реалізований у Веці" :)
mpiktas

Драт, я отримав старішу версію книги! Дуже дякую, що вказали на це джерело!
Пластівці

Відповіді:


8

Схоже, глибоке навчання може бути для вас дуже цікавим. Це зовсім недавнє поле глибоких коннекціоністських моделей, які перевіряються без нагляду і детально налаштовуються під наглядом. Тонка настройка вимагає значно менших зразків, ніж попередня перевірка.

Щоб намочити язик, рекомендую [Семантиг Хашинг Салахутдінов, Хінтон . Погляньте на коди, які знайде для окремих документів корпусу Reuters: (без нагляду!)

введіть тут опис зображення

Якщо вам потрібен якийсь код, перегляньте deeplearning.net . Але я не вірю, що є нестандартні рішення.


Це досить цікава і нова інформація для мене. Звичайно, поза реалізацією коробки було б краще, але це дійсно допомагає мені знати щось ближче до того, що я хочу. Спасибі.
Пластівці

5

Ізабел Гайон (та колеги) організували виклик щодо активного навчання натомість, опубліковані тут матеріали (відкритий доступ). Це має перевагу в тому, що це досить практично, і ви можете безпосередньо порівнювати виконання різних підходів за неупередженим (у розмовному розумінні) протоколом (випадковий вибір шаблонів напрочуд важко перемогти).


Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.