У алгоритмі теми теми LDA я бачив це припущення. Але я не знаю, чому обрав диріхлет? Я не знаю, чи можемо ми використовувати уніфікований розподіл по Multinomial як пару?
У алгоритмі теми теми LDA я бачив це припущення. Але я не знаю, чому обрав диріхлет? Я не знаю, чи можемо ми використовувати уніфікований розподіл по Multinomial як пару?
Відповіді:
Розподіл Діріхле - це кон'югат, що передує багаточленному розподілу. Це означає, що якщо попереднім розподілом багаточленних параметрів є Діріхлет, то задній розподіл також є розподілом Діріхле (з параметрами, відмінними від попередніх). Перевага цього полягає в тому, що (a) задній розподіл легко обчислити, і (b) в деякому сенсі можна кількісно оцінити, наскільки змінилися наші переконання після збору даних.
Звичайно, можна обговорити, чи є це вагомі причини для вибору конкретного попереднього, оскільки ці критерії не пов'язані з фактичними попередніми переконаннями ... Тим не менш, споріднені пріори популярні, оскільки вони часто є досить гнучкими та зручними у використанні з причин, зазначених вище .
Для особливого випадку мультиноміального розподілу нехай є вектором мультиноміальних параметрів (тобто ймовірностей для різних категорій). Якщо до збору даних, то, враховуючи спостереження у різних категоріях,
Рівномірний розподіл - це фактично особливий випадок розподілу Діріхле, відповідний випадку . Так є найменш інформативний попередній Джефріс , для якого . Той факт, що клас Діріхле включає ці природні «неінформативні» пріори, є ще однією причиною їх використання.
На додаток, а не протиріччя з відповіддю Мен Т , я просто зазначаю, що в байесовському моделюванні такого поняття немає як "попереднє"! Розподіл Диріхле є зручним вибором через (а) кон'югацію, (б) обчислення та (в) зв’язок з непараметричною статистикою (оскільки це дискретизована версія процесу Діріхле).
Однак (i) все, що раніше ви ставите на ваги мультином, є правомірною відповіддю на суб'єктивному рівні Байєса, і (ii) у разі наявності попередньої інформації немає ніяких причин, щоб це спростило розподіл Діріхле. Зауважимо також, що суміші та згортання розподілів Діріхле можна використовувати в якості пріорів.