Так, у (непідконтрольному) текстовому моделюванні, латентне розподілення Діріхле (LDA) є баєсовою версією ймовірнісного латентного семантичного аналізу (PLSA). По суті, LDA = PLSA + Діріхле перед своїми параметрами. Я розумію, що LDA тепер є контрольним алгоритмом і реалізується в різних пакетах, тоді як PLSA більше не слід використовувати.
Але в (під наглядом) текстовій категоризації ми могли б зробити саме те ж саме для багаточленного класичного Naive Bayes і поставити Діріхле перед попередніми параметрами. Але я не думаю, що я ніколи не бачив, щоб хтось робив це, і версія "багатоцільової оцінки" багаточленних Naive Bayes, здається, є версією, реалізованою в більшості пакетів. Чи є причина для цього?