Показники ефективності для оцінки непідвладного навчання


49

Що стосується непідконтрольного навчання (наприклад, кластеризації), чи є які-небудь показники для оцінки ефективності?



4
Я думаю, що це питання більш загальне, ніж це, тому я голосую, щоб залишити це відкритим.
Пітер Флом - Відновити Моніку

У мене виникло те саме питання, що і у вас, і є деякі (на сьогодні ще не повністю прочитані) посилання: Дослідження щодо внутрішньої міри дійсності для перевірки кластерів Л. Джегати Дебори, Р. Баскаран, А. Кананна та методики вимірювання валідності кластерів Ferenc Kovács, Csaba Legány, Attila Babos
kasterma

Відповіді:


44

У певному сенсі я думаю, що це питання є невиправданим. Я говорю це, тому що від того, наскільки добре працює той чи інший непідконтрольний метод, багато в чому залежатиме від того, чому в першу чергу ви навчаєтесь без нагляду, тобто чи добре працює метод у контексті вашої кінцевої мети? Очевидно, це не зовсім вірно, люди працюють над цими проблемами і публікують результати, які включають якусь оцінку. Я викладу кілька підходів, з якими я знайомий нижче.

Хорошим ресурсом (з посиланнями) для кластеризації є сторінка документації sklearn, Оцінка ефективності кластеризації . Це стосується декількох методів, але всі, окрім одного, коефіцієнт силуету, передбачають, що ярлики основної правди доступні. Цей метод також згадується у питанні Оцінювальний захід кластеризації , пов'язаний у коментарях до цього питання.

Якщо ваш непідконтрольний метод навчання є імовірнісним, ще одним варіантом є оцінка певної міри ймовірності (ймовірність журналу, здивування і т. Д.) За витриманими даними. Мотивація тут полягає в тому, що якщо ваш непідконтрольний метод навчання призначає високу ймовірність аналогічним даним, які не використовувались для встановлення параметрів, то він, ймовірно, зробив хорошу роботу з фіксації розподілу інтересів. Домен, де зазвичай використовується такий тип оцінки, - це мовне моделювання.

Останній варіант, який я зазначу, - це використання підконтрольного учня для відповідного допоміжного завдання. Якщо метод без нагляду виробляє приховані змінні, ви можете вважати ці латентні змінні як представлення вхідних даних. Таким чином, ці латентні змінні доцільно використовувати як вхід для керованого класифікатора, який виконує певну задачу, пов’язану з доменом, з якого дані. Виконання контрольованого методу може потім слугувати сурогатом для ефективності непідконтрольного учня. Це, по суті, налаштування, яке ви бачите в більшості робіт з навчання представництву.

Цей опис, мабуть, трохи неясний, тому я наведу конкретний приклад. Майже вся робота з вивчення подання слів використовує такий підхід для оцінювання:

  1. Вивчіть подання слів за допомогою непідконтрольного учня.
  2. Використовуйте засвоєні уявлення як вхідні дані для підконтрольного учня, який виконує якесь завдання NLP, наприклад, частини тегів мови або розпізнавання названих об'єктів.
  3. Оцініть результативність непідконтрольного учня його здатності покращувати продуктивність контрольованого учня порівняно з базовою лінією, використовуючи в якості введення стандартне подання, як, наприклад, функції бінарного слова.

Для прикладу такого підходу в дії дивіться статтю Навчальні машини з обмеженою діяльністю Больцмана щодо спостереження за словами Даля та ін.


11
+1 "від того, наскільки добре працює той чи інший непідконтрольний метод, багато в чому залежатиме від того, чому в першу чергу займається непідконтрольним навчанням", в значній мірі підсумовується це. Не шукайте якогось магічного числа, яке ви можете якось використати для обгрунтування заданого результату, фактично не інтерпретуючи результат .
Marc Claesen

1
Я також хочу додати, що використання контрольованого підходу як проксі для того, наскільки добре працює непідконтрольний підхід, не вимагає відкриття нових функцій. Наприклад, кластеризація не вивчає нових функцій, але кластеризація часто використовується для підвищення точності прогнозування контрольованого учня, з додатковою перевагою пояснення, чому це може бути так. Наприклад, кластеризація k-засобів може виробляти k передбачення, які вдосконалюються шляхом використання виявленої структури та стиснення від кластеризації. Дивіться ttic.uchicago.edu/~shubhendu/Papers/clustering_bagging.pdf
Кібернетичний
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.