Коли глибоке навчання надмірне навчання?


15

Наприклад, для класифікації електронних листів як спаму, чи варто - з точки зору часу / точності - застосовувати глибоке навчання (якщо можливо) замість іншого алгоритму машинного навчання? Чи глибоке навчання зробить інші алгоритми машинного навчання, як наївний Байєс, непотрібними?

Відповіді:


13

Вся справа в поверненні інвестицій . Якщо DL "варто зробити", це не зайве.

Якщо вартість використання DL (комп'ютерні цикли, зберігання, час навчання) є прийнятною, а наявних даних для її навчання достатньо, а якщо гранична перевага перед альтернативними алгоритмами цінна, то DL - це виграш.

Але, як ви підказуєте, якщо ваша проблема піддається альтернативним методам, особливо якщо вона пропонує сигнал, який добре відповідає класичним методам, таким як регресія чи наївний Байєс, або ваша проблема потребує пояснення, чому межа рішення є там, де вона є (наприклад, дерева рішень) або якщо вашим даним не вистачає безперервних градієнтів, необхідних DL (особливо, CNN), або ваші дані змінюються з часом, що вимагало б періодичної перепідготовки (особливо з непередбачуваними інтервалами), то DL, ймовірно, є для вас невідповідним.


12

Глибоке навчання є потужним, але це не є вищим методом, ніж байєсівський. Вони добре працюють над тим, що призначені для цього:

Використовуйте глибоке навчання:

  • Витрати на обчислення значно дешевші, ніж вартість вибірки (наприклад: обробка природним мовою)
  • Якщо у вас є дуже нелінійна проблема
  • Якщо ви хочете спростити інженерію функцій
  • Якщо у вас немає попереднього розподілу (наприклад: встановлення ваг на випадкові гауссові). Або так, але ви не заперечуєте проти складності.
  • Якщо ви хочете точності для швидкості (глибоке навчання повільне)

Використовуйте наївних байесів:

  • Якщо у вас є попередній розподіл, який ви хочете використовувати
  • Якщо ви хочете швидко та легко оновити свою модель (зокрема, кон'юнктурні)
  • Якщо у вас є своя функція вірогідності та ви хочете «контролювати», як саме працює модель
  • Якщо ви хочете моделювати ієрархічні моделі
  • Якщо ви не хочете налаштувати параметри
  • Якщо ви хочете більш швидкої моделі, як у навчанні, так і у виконанні
  • Якщо ви хочете зробити припущення про незалежність
  • Якщо ви хочете попередити надмірний монтаж (це дуже проста модель)
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.