Генеративні та дискримінаційні моделі (в баєсівському контексті)


22

Які відмінності між генеративною та дискримінаційною (дискримінантною) моделлю (в контексті байєсівського навчання та умовиводу)?

і що це стосується прогнозування, теорії рішень або непідконтрольного навчання?


Вибачте, я не розумію, що ви маєте на увазі під другим реченням. Чи спробуєте ви переробити це?
csgillespie

о, я щойно приєднався до світу статистики та машинного навчання, вибачте, що не знайшов, як пов’язати непідконтрольне навчання теорії рішення. але я все ще вчуся!
nkint

1
Я просто плутаю, як це вписується в питання. Наприклад, слова "передбачення", "теорія рішення" або "непідконтрольне" не відображаються у прийнятій відповіді
csgillespie

Відповіді:


35

Обидва використовуються в контрольованому навчанні, де потрібно вивчити правило, яке відображає введення x на вихід y, враховуючи ряд навчальних прикладів форми . Генеративна модель (наприклад, наївний Байєс) явно моделює спільний розподіл ймовірностей а потім використовує правило Байєса для обчислення . З іншого боку, дискримінаційна модель (наприклад, логістична регресія) безпосередньо моделює p (y | x) .{(хi,уi)}p(х,у)p(у|х)p(у|х)

Деякі люди стверджують, що дискримінаційна модель краща в тому сенсі, що вона безпосередньо моделює кількість, про яку ви дбаєте (у) , тому вам не доведеться витрачати свої зусилля на моделювання на вхід x (потрібно обчислити p(х|у) а також у генеративній моделі). Однак у генеративної моделі є свої переваги, такі як можливість поводження з відсутніми даними тощо. Для порівняння ви можете поглянути на цей документ: Про дискримінаційні та генеративні класифікатори: порівняння логістичної регресії та наївних байєсів

Можуть бути випадки, коли одна модель краща за іншу (наприклад, дискримінаційні моделі, як правило, краще, якщо у вас є багато даних; генеративні моделі можуть бути кращими, якщо у вас є кілька зайвих незазначених даних). Насправді, існують і моделі гібридів, які намагаються втілити найкращі з обох світів. Для прикладу див. Цей документ: Принципові гібриди генеративних та дискримінаційних моделей


1
Гарна відповідь. Що стосується порівняння канонічних прикладів дискримінаційних та генеративних класифікаторів (логістична регресія та гауссовий наївний Байєс відповідно), я вважав, що ця книга книги є дуже доступною, ніж Ng: cs.cmu.edu/~tom/mlbook/NBayesLogReg.pdf
Josh Геманн

3

Одне доповнення до вищезгаданої відповіді:

Оскільки дискримінант піклується лише про P (Y | X), тоді як генеративний стосується P (X, Y) і P (X) одночасно, для того щоб добре передбачити P (Y | X), генеративна модель має менший ступінь свободи в моделі порівняно з дискримінантною моделлю. Тож генеративна модель є більш надійною , менш схильною до надмірного оснащення, тоді як дискримінант - це навпаки.

Це пояснює вищезгадану відповідь

Можуть бути випадки, коли одна модель краща за іншу (наприклад, дискримінаційні моделі, як правило, краще, якщо у вас багато даних; генеративні моделі можуть бути кращими, якщо у вас є кілька зайвих незазначених даних).


2
Чи можете ви пояснити, що ви говорите про те, що генеративні моделі мають менший ступінь свободи? Доказ? Посилання? Спасибі
Патрік
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.