У контексті машинного навчання, в чому різниця між
- непідконтрольне навчання
- контрольоване навчання та
- напівконтрольне навчання?
І які основні алгоритмічні підходи слід переглянути?
У контексті машинного навчання, в чому різниця між
І які основні алгоритмічні підходи слід переглянути?
Відповіді:
Як правило, проблемами машинного навчання можна вважати варіації оцінки функцій для класифікації, прогнозування чи моделювання.
При контрольованому навчанні один з них вводиться введенням ( , , ...,) і виведенням ( , , ...,) і кидає виклик пошуку функції, яка наближає цю поведінку до узагальнення. Вихід може бути ярликом класу (в класифікації) або реальним числом (в регресії) - це "нагляд" за контрольованим навчанням.
Що стосується непідконтрольного навчання , у базовому випадку ви отримуєте входи , , ..., але ні цільові результати, ні винагороди від його оточення не передбачені. Виходячи з проблеми (класифікувати або прогнозувати) та ваших базових знань пробного простору, ви можете використовувати різні методи: оцінку щільності (оцінювання деяких базових PDF для прогнозування), k-засоби кластеризації (класифікацію не маркованих реальних цінних даних), k- режими кластеризації (класифікація незазначених категоричних даних) тощо.
Напівконтрольне навчання передбачає оцінку функції на мічених і не маркованих даних. Такий підхід мотивований тим, що марковані дані часто дорого формуються, тоді як без маркованих даних це взагалі немає. Виклик тут здебільшого пов'язаний з технічним питанням, як поводитися зі змішаними даними способами. Докладнішу інформацію про напівконтрольовані методи навчання див. У напівконтрольному навчальній літературі .
На додаток до цих видів навчання, є й інші, такі як підкріплення навчання за допомогою чого метод навчання взаємодіє з навколишнім середовищем, виробляючи дії 1 , 2 ,. . .. які приносять винагороду або покарання r 1 , , ...
Навчання без нагляду
Навчання без нагляду - це коли у вас немає мічених даних для навчання. Прикладами цього часто є методи кластеризації.
Контрольоване навчання
У цьому випадку ваші дані тренінгу існують із мічених даних. Проблема, яку ви вирішуєте тут, часто передбачає мітки для точок даних без мітки.
Навчальне навчання
У цьому випадку використовуються як мічені дані, так і немарковані дані. Наприклад, це може бути використано в мережах глибоких переконань, де деякі шари вивчають структуру даних (без нагляду), а один шар використовується для складання класифікації (підготовлений з контрольованими даними)
Я не думаю, що контрольований / непідконтрольний - це найкращий спосіб думати про це. Для базового обміну даними краще подумати про те, що ви намагаєтеся зробити. Існує чотири основні завдання:
передбачення якщо ви прогнозуєте реальну кількість, це називається регресією. якщо ви прогнозуєте ціле число або клас, це називається класифікацією.
ліплення. моделювання - це те саме, що і прогнозування, але модель зрозуміла людям. Нейронні мережі та підтримуючі векторні машини працюють чудово, але не створюють зрозумілих моделей [1]. дерева рішень та класична лінійна регресія - приклади легко зрозумілих моделей.
подібність. якщо ви намагаєтеся знайти природні групи ознак, це називається факторним аналізом. якщо ви намагаєтеся знайти природні групи спостережень, це називається кластеризацією.
об'єднання. це дуже схоже на кореляцію, але для величезних бінарних наборів даних.
[1] Мабуть, Goldman Sachs створив багато чудових нейронних мереж для прогнозування, але тоді ніхто їх не зрозумів, тому їм довелося писати інші програми, щоб спробувати пояснити нейронні мережі.