Ми вивчаємо машинне навчання за допомогою машинного навчання: ймовірнісна перспектива (Кевін Мерфі). Хоча текст пояснює теоретичну основу кожного алгоритму, він рідко каже, у якому випадку, який алгоритм кращий, а коли це робиться, він не говорить, як сказати, у якому випадку я перебуваю.
Наприклад, для вибору ядра мені сказали робити дослідницький аналіз даних, щоб оцінити, наскільки складні мої дані. У простих двовимірних даних я можу побудувати графік і побачити, чи підходить лінійне або радіальне ядро. Але що робити у вищому вимірі?
Загалом, що означають люди, коли вони говорять "ознайомтеся з вашими даними" перед тим, як вибрати алгоритм? Зараз я можу розрізняти лише алгоритм класифікації та регресії та лінійний проти нелінійний алгоритм (який я не можу перевірити).
EDIT: Незважаючи на те, що моє первісне питання стосується загального правила, мене попросили надати більше інформації щодо моєї конкретної проблеми.
Дані: Панель з кожним рядком, що складається із країни-місяця (~ 30 000 рядків, що охоплює ~ 165 країн за ~ 15 років).
Відповідь: 5 бінарних змінних, що цікавлять (тобто чи трапляються протести / перевороти / криза тощо) у тому місяці.
Особливості: ~ 400 змінних (сукупність безперервних, категоричних, бінарних), де деталізується купа характеристик для двох попередніх країн-місяців (може бути створено довше затримка). Ми використовуємо лише відсталу змінну, оскільки мета - прогнозування.
Приклади включають, обмінний курс, зростання ВВП (безперервний), рівень вільної преси (категоричний), демократію, чи має сусід конфлікт (бінарний). Зауважте, що багато з цих 400 функцій є змінними, що відстають.