Контрольоване навчання
- 1) Людина будує класифікатор на основі вхідних та вихідних даних
- 2) Цей класифікатор навчається з навчальним набором даних
- 3) Цей класифікатор тестується за допомогою тестового набору даних
- 4) Розгортання, якщо вихід задовільний
Для використання, коли: "Я знаю, як класифікувати ці дані, мені просто потрібно (класифікатор) для їх сортування".
Точка методу: Класифікація міток або отримання реальних чисел
Непідконтрольне навчання
- 1) Людина будує алгоритм на основі вхідних даних
- 2) Цей алгоритм тестується за допомогою тестового набору даних (в якому алгоритм створює класифікатор)
- 3) Розгортання, якщо класифікатор задовільний
Для використання, коли: "Я не маю уявлення, як класифікувати ці дані, чи можете ви (алгоритм) створити для мене класифікатор?"
Точка методу: класифікація міток або передбачення (PDF)
Підсилення навчання
- 1) Людина будує алгоритм на основі вхідних даних
- 2) Цей алгоритм відображає стан, залежний від вхідних даних, у якому користувач винагороджує або карає алгоритм через дію, яку алгоритм здійснив, це триває з часом
- 3) Цей алгоритм вчиться на винагороді / покаранні і оновлює себе, це продовжується
- 4) Це завжди у виробництві, йому потрібно вивчити реальні дані, щоб мати змогу представляти дії від держав
Для використання, коли: "Я не маю уявлення, як класифікувати ці дані, чи можете ви класифікувати ці дані, і я дам вам нагороду, якщо вони правильні, або я покараю вас, якщо це не так".
Це такий потік цих практик, я багато чую про те, що вони роблять, але практичної та зразкової інформації жахливо мало!