Я знаю, що генеративні засоби "засновані на ", а дискримінаційні засоби "засновані на ", але я плутаюся в декількох моментах:
Вікіпедія (+ багато інших звернень до Інтернету) класифікує такі речі, як SVM та дерева рішень, як дискримінаційні. Але вони навіть не мають ймовірнісних тлумачень. Що тут означає дискримінація? Чи дискримінація стала означати все, що не є генеративним?
Naive Bayes (NB) є генеративним, оскільки він фіксує і , і, таким чином, у вас (а також ). Хіба не тривіально зробити, скажімо, логістичну регресію (хлопець-постер з дискримінаційних моделей) "генеративної", просто обчисливши аналогічним чином (те саме припущення про незалежність, як NB, таке, що , де MLE для - просто частоти)?
Я знаю, що дискримінаційні моделі, як правило, перевершують генеративні. Яке практичне використання роботи з генеративними моделями? Цитується можливість генерування / моделювання даних, але коли це з'являється? У мене особисто є лише досвід регресії, класифікації, колабсу. фільтрація за структурованими даними, тож використання для мене тут не має значення? Аргумент "відсутні дані" ( для відсутнього x i ), здається, дає вам лише перевагу з навчальними даними (коли ви насправді знаєте y та не потрібно маргіналізувати над P ( y ), щоб отримати відносно німий P ( x i яку ви могли б оцінити безпосередньо в будь-якому випадку), і навіть тоді імпутація набагато гнучкіша (можна передбачити, базуючись не лише на y, а й на інших x i ).
Що з цілком суперечливими цитатами з Вікіпедії? "генеративні моделі, як правило, більш гнучкі, ніж дискримінаційні моделі у вираженні залежностей у складних навчальних завданнях" порівняно з "дискримінаційні моделі, як правило, можуть виражати більш складні зв'язки між спостережуваними та цільовими змінними"
Пов'язане питання, яке змусило мене замислитися над цим.