У чому саме різниця між контрольованим та непідконтрольним навчанням?


28

Я намагаюся зрозуміти методи кластеризації.

Що я думаю, я зрозумів:

  1. При контрольованому навчанні дані категорій / міток присвоюються відомим до обчислення. Отже, мітки, класи або категорії використовуються для того, щоб "вивчити" параметри, які дійсно значущі для цих кластерів.

  2. У навчанні без нагляду набори даних присвоюються сегментам, без відомих кластерів.

Чи означає це, що якщо я навіть не знаю, які параметри мають вирішальне значення для сегментації, я повинен віддати перевагу навчанню під контролем?


2
Зауважте, що кластеризація - не єдиний тип навчання без нагляду.
Джордж

1
Контрольоване навчання є кращим, коли доступні мічені дані про навчання. Ви можете розділити свої дані за допомогою контрольованих або непідконтрольних методів. Основна відмінність полягає в тому, що в контрольованій обстановці ви знаєте ПРАВИЛЬНУ сегментацію своїх навчальних даних.
Нік

Відповіді:


23

Різниця полягає в тому, що при контрольованому навчанні відомі "категорії", "класи" або "етикетки". У навчанні без нагляду їх немає, і процес навчання намагається знайти відповідні "категорії". В обох видах навчання всі параметри вважаються для визначення того, які найбільш підходять для класифікації.

Незалежно від того, вибрали ви підконтрольний чи непідконтрольний, слід базуватися на тому, чи знаєте ви, що таке "категорії" ваших даних. Якщо ви знаєте, використовуйте контрольоване навчання. Якщо ви не знаєте, то використовуйте без нагляду.

Оскільки у вас є велика кількість параметрів і ви не знаєте, які з них є релевантними, ви можете використовувати щось на зразок принципового аналізу компонентів, щоб допомогти визначити відповідні.


13

Зауважте, що існує понад 2 ступеня нагляду. Наприклад, див. Стор . 24-25 (6-7) в кандидатській дисертації Крістіана Бімана, Непідконтрольне та без знання знань природнича мова в парадигмі відкриття структури, 2007.

У дисертації визначено 4 ступеня: контрольований, напівпіднаглядний, слабоконтрольований та непідконтрольний, та пояснює відмінності в контексті обробки природних мов. Ось відповідні визначення:

  • У контрольованих системах дані, представлені алгоритму машинного навчання, повністю позначені. Це означає: усі приклади представлені класифікацією, яку машина повинна відтворювати. Для цього класифікатор засвоюється з даних, процес присвоєння міток ще небаченим екземплярам називається класифікацією.
  • У напівнаглядових системах машині дозволяється додатково враховувати незазначені дані. Завдяки більшій основі даних, напівнаглядові системи часто перевершують своїх контрольованих аналогів, використовуючи ті ж мічені приклади. Причиною цього вдосконалення є те, що більш незазначені дані дозволяють системі більш точно моделювати притаманну структуру даних.
  • Запуск завантажувальних програм, яка також називається самонавчанням, - це форма навчання, яка покликана використовувати ще менше прикладів навчання, тому іноді називається слабко контрольованою . Запуск завантаження починається з кількох навчальних прикладів, навчає класифікатора та використовує продумані позитивні приклади, що даються цим класифікатором для перепідготовки. Зі збільшенням набору навчальних прикладів класифікатор вдосконалюється за умови, що не надто багато негативних прикладів класифікуються як позитивні, що може призвести до погіршення працездатності.
  • Неконтрольовані системи не передбачено будь - яких навчальні приклади взагалі і поведінку кластеризації. Це поділ екземплярів даних на кілька груп. Результати алгоритмів кластеризації керуються даними, отже, більш "природними" і краще підходять до базової структури даних. Ця перевага також є його головним недоліком: без можливості сказати машині, що робити (наприклад, у класифікації), важко судити про якість результатів кластеризації. Але відсутність підготовки прикладу для навчання робить непідконтрольну парадигму дуже привабливою.

0

При навчанні під керівництвом заняття відомі заздалегідь, а також їхні види, наприклад, два класи хороших та поганих клієнтів. Коли новий об'єкт (замовник) з'являється на основі його атрибутів, замовник може бути віднесений до поганого або хорошого класу клієнтів.

У процесі навчання без нагляду групи / класи вже не відомі, у нас є об'єкти (клієнти), тому групуйте клієнтів, що мають подібні звички покупців, отже, різні групи складаються з клієнтів, тобто не відомі вже на основі подібних звичок покупки.


0

У контрольованому навчанні вихід (залежна змінна) залежить від вхідної змінної (незалежної змінної). У деякому наборі заданих контролів респондент намагається обчислити бажану мету.

У навчанні без нагляду немає нагляду, тому система намагається адаптуватися до ситуації і вчиться вручну, виходячи з певної міри.

наприклад: Вчитель у класі - нагляд - нагляд за навчанням - Самостійне навчання за вибором у класі - Без нагляду Непідконтрольне навчання

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.