Навчання без нагляду, нагляду та напівконтролю


27

У контексті машинного навчання, в чому різниця між

  • непідконтрольне навчання
  • контрольоване навчання та
  • напівконтрольне навчання?

І які основні алгоритмічні підходи слід переглянути?


8
По-перше, два рядки з вікі: "В інформатиці напівпідконтрольне навчання - це клас машинного навчання, що використовує для навчання як мічені, так і немечені дані - як правило, це невелика кількість мічених даних з великою кількістю незазначених даних. Напівконтрольне навчання потрапляє між непідконтрольним навчанням (без жодних мічених даних про навчання) та контрольованим навчанням (із повністю міченими даними про навчання) ". Чи допомагає це?

Що ви маєте на увазі з "Алгоритмічними підходами"? Я дав кілька прикладів додатків у своїй відповіді, це те, що ви шукаєте?
Пітер Сміт

Відповіді:


20

Як правило, проблемами машинного навчання можна вважати варіації оцінки функцій для класифікації, прогнозування чи моделювання.

При контрольованому навчанні один з них вводиться введенням ( х1 , х2 , ...,) і виведенням ( у1 , у2 , ...,) і кидає виклик пошуку функції, яка наближає цю поведінку до узагальнення. Вихід може бути ярликом класу (в класифікації) або реальним числом (в регресії) - це "нагляд" за контрольованим навчанням.

Що стосується непідконтрольного навчання , у базовому випадку ви отримуєте входи х1 , х2 , ..., але ні цільові результати, ні винагороди від його оточення не передбачені. Виходячи з проблеми (класифікувати або прогнозувати) та ваших базових знань пробного простору, ви можете використовувати різні методи: оцінку щільності (оцінювання деяких базових PDF для прогнозування), k-засоби кластеризації (класифікацію не маркованих реальних цінних даних), k- режими кластеризації (класифікація незазначених категоричних даних) тощо.

Напівконтрольне навчання передбачає оцінку функції на мічених і не маркованих даних. Такий підхід мотивований тим, що марковані дані часто дорого формуються, тоді як без маркованих даних це взагалі немає. Виклик тут здебільшого пов'язаний з технічним питанням, як поводитися зі змішаними даними способами. Докладнішу інформацію про напівконтрольовані методи навчання див. У напівконтрольному навчальній літературі .

На додаток до цих видів навчання, є й інші, такі як підкріплення навчання за допомогою чого метод навчання взаємодіє з навколишнім середовищем, виробляючи дії 1 , 2 ,. . .. які приносять винагороду або покарання r 1а1а2r1 , r2 , ...


1
Ваша відповідь передбачає, що навчання під контролем є кращим перед навчанням, яке набуває нагляду під наглядом, де це можливо. Це правильно? Якщо ні, то коли напівпіднагляд може бути кращим?
naught101

@ naught101 Як ти це читаєш з його відповіді? Я погоджуюся з тим, що каже Джон, але я б сказав протилежне тому, що ви говорите, а саме, що напівконтрольне навчання є кращим, ніж навчання під контролем, де це можливо. Тобто, якщо у вас є деякі мічені дані та деякі немарковані дані (як правило, набагато більше, ніж кількість мічених даних), вам краще, якщо ви зможете використовувати всі дані, ніж якби ви могли використовувати лише мічені дані. Весь сенс використання напівконтрольного навчання полягає в тому, щоб перевершити результативність, отриману завдяки навчанню під контролем або без нагляду.
HelloGoodbye

@HelloGoodbye: тому що для напівконтрольного навчання єдина перевага, яка полягає в тому, що в деяких випадках вона дешевша, але це має додатковий прогрес, який є більш складним. Мені здається розумним, що повне керування навчанням було б простішим і точнішим (за інших рівних умов), враховуючи, що надаються більш основні дані правди. Тож я просто просив приклади, де, зважаючи на вибір між двома, переважніше було б напівнагляд. Ваш коментар має сенс, але чи є випадок, коли всі дані маркуються, і ви все одно віддаєте перевагу напівнагляду?
naught101

@ naught101 Я думаю, якщо всі дані марковані, ви не дуже виграєте, використовуючи напівконтрольне навчання замість того, щоб використовувати звичайне контрольоване навчання. Коли у вас є безліч маркованих даних і ви навчаєтесь під наглядом, головна причина, що ви бачите покращену ефективність, полягає в тому, що ви переносите навчання і можете черпати досвід і з незазначених даних.
HelloGoodbye

@ naught101 Однак, даючи мережі завдання відтворити вхідні дані якнайкраще з вихідних даних (тобто реалізувати автокодер, який є своєрідним без нагляду навчанням), мережа змушена вчитися хорошим уявленням даних. Це може діяти як різновид регуляризації, що, у свою чергу, також може виявитися корисним. Таким чином, може бути невеликий виграш від використання напівконтрольного навчання замість звичайного контрольованого навчання, навіть якщо всі дані будуть марковані. Наскільки цей ефект великий, я не знаю.
HelloGoodbye

13

Навчання без нагляду

Навчання без нагляду - це коли у вас немає мічених даних для навчання. Прикладами цього часто є методи кластеризації.

Контрольоване навчання

У цьому випадку ваші дані тренінгу існують із мічених даних. Проблема, яку ви вирішуєте тут, часто передбачає мітки для точок даних без мітки.

Навчальне навчання

У цьому випадку використовуються як мічені дані, так і немарковані дані. Наприклад, це може бути використано в мережах глибоких переконань, де деякі шари вивчають структуру даних (без нагляду), а один шар використовується для складання класифікації (підготовлений з контрольованими даними)


7

Я не думаю, що контрольований / непідконтрольний - це найкращий спосіб думати про це. Для базового обміну даними краще подумати про те, що ви намагаєтеся зробити. Існує чотири основні завдання:

  1. передбачення якщо ви прогнозуєте реальну кількість, це називається регресією. якщо ви прогнозуєте ціле число або клас, це називається класифікацією.

  2. ліплення. моделювання - це те саме, що і прогнозування, але модель зрозуміла людям. Нейронні мережі та підтримуючі векторні машини працюють чудово, але не створюють зрозумілих моделей [1]. дерева рішень та класична лінійна регресія - приклади легко зрозумілих моделей.

  3. подібність. якщо ви намагаєтеся знайти природні групи ознак, це називається факторним аналізом. якщо ви намагаєтеся знайти природні групи спостережень, це називається кластеризацією.

  4. об'єднання. це дуже схоже на кореляцію, але для величезних бінарних наборів даних.

[1] Мабуть, Goldman Sachs створив багато чудових нейронних мереж для прогнозування, але тоді ніхто їх не зрозумів, тому їм довелося писати інші програми, щоб спробувати пояснити нейронні мережі.


Ви можете дати більше інформації про GS-історію? (не впевнений, чому я не можу коментувати прямо ваш коментар)
YA

я не можу точно пригадати, де я це читав, але ось трохи більше інформації про AI @ GS: hplusmagazine.com/2009/08/06/…
Ніл

У мене таке відчуття, що 1,2 описують навчання в контрольованій обстановці, а 3,4 проживають у непідконтрольних умовах. Також: що робити, якщо шукати подібності, щоб передбачити? Це вважається моделюванням?
Містер Цьолдер
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.