Коли я відкриваю машинне навчання, я бачу різні цікаві методи, такі як:
- автоматично налаштовувати алгоритми з такими методами, як
grid search
, - отримати більш точні результати за допомогою комбінації різних алгоритмів одного "типу"
boosting
, - отримати більш точні результати за рахунок поєднання різних алгоритмів (але не той же самий тип алгоритмів), це
stacking
, - і, напевно, ще багато чого мені ще належить відкрити ...
Моє запитання таке: є всі ці твори. Але чи можливо їх скласти разом, щоб скласти алгоритм, який приймає як вхідні очищені дані та виводить хороші результати, беручи найкращі з усіх методів? (Звичайно, професійним вченим з даних буде, мабуть, менш ефективно, але він буде кращим за мене!) Якщо так, чи є у вас зразки кодів чи ви знаєте рамки, які можуть це зробити?
EDIT: Після деяких відповідей, здається, необхідно зробити деяке звуження. Візьмемо для прикладу, у нас є один стовпчик з категоричними даними, назвемо його y
і ми хочемо передбачити це з числових даних, X
що є або манекенами, або реальними числовими даними (висота, температура). Ми припускаємо, що чистка була зроблена раніше. Чи існує алгоритм, який може приймати такі дані і давати прогноз? (тестуючи декілька алгоритмів, налаштовуючи їх, збільшуючи їх і т.д.) Якщо так, чи є обчислювально ефективним (чи обчислення робляться в розумний час, якщо порівняти зі звичайним алгоритмом), і чи є у вас приклад коду?
auto.arima
(з forecast
бібліотеки) може бути краще, ніж люди, - Роб Хайндман кілька разів згадував у своїх презентаціях. Тож є області, де якісь "автоматичні навчання" застосовуються з успіхом.