Я є новачком у машинному навчанні (також деяка статистика), на деякий час вивчав знання (контрольовані / непідтримувані алгоритми навчання, відповідні методи оптимізації, регуляризація, деякі філософії (наприклад, компроміс з відхиленням відхилення?)). Я знаю, що без будь-якої реальної практики я не отримав би глибокого розуміння цих матеріалів машинного навчання.
Тож я розпочну з якоїсь проблеми класифікації з реальними даними, скажімо, від руки написана цифра (MNIST). На мій подив, без будь-яких особливостей навчання / інженерії точність досягає 0,97, використовуючи класифікатор випадкових лісових масивів із значеннями необроблених пікселів. Я також спробував інші алгоритми навчання, такі як SVM, LR з налаштованими параметрами.
Тоді я заблукав, чи буде це занадто просто чи я щось тут пропускаю? Просто підберіть алгоритм навчання з інструментарію та налаштуйте деякі параметри?
Якби це стосувалося машинного навчання на практиці, я би втрачала інтерес до цієї галузі. Я кілька днів думав і читав щоденники, і прийшов до деяких висновків:
Найважливішою частиною машинного навчання на практиці є функціональна інженерія , тобто, з огляду на дані, з’ясувати краще представлення особливостей.
Який алгоритм навчання використовувати також важливо, також налаштування параметрів, але остаточний вибір стосується експерименту.
Я не впевнений, що я це правильно розумію, сподіваючись, що хтось може мене виправити і дати мені якусь пропозицію щодо машинного навчання на практиці.