Відповідь залежить від того, припускаючи симетричне або асиметричне розподіл Діріхле (або, більш технічно, є чи базова міра однорідна). Якщо щось інше не вказано, більшість реалізацій LDA припускають, що розподіл є симетричним.
Для симетричного розподілу високе значення альфа означає, що кожен документ, ймовірно, містить суміш більшості тем, а не будь-яку окрему тему. Низьке значення альфа ставить менше таких обмежень для документів і означає, що більш імовірно, що документ може містити суміш лише декількох, а то й лише однієї теми. Так само, високе значення бета-версії означає, що кожна тема може містити суміш більшості слів, а не будь-яке слово конкретно, тоді як низьке значення означає, що тема може містити суміш з декількох слів.
Якщо, з іншого боку, розподіл асиметричний, високе значення альфа означає, що певний розподіл теми (залежно від базової міри) є більш імовірним для кожного документа. Аналогічно, високі бета-значення означають, що кожна тема має більше шансів містити певний поєднання слів, визначений базовим показником.
На практиці висока альфа-величина призведе до того, що документи будуть схожішими за темою, яку вони містять. Високе значення бета-версії також призведе до того, що теми будуть схожішими за змістом, які вони містять.
Так, так, альфа-параметри задають попередні переконання щодо нерівномірності / рівномірності теми в документах. Я не зовсім впевнений, що ви маєте на увазі під "взаємною ексклюзивністю тем із точки зору слів".
Більш загально це параметри концентрації для розподілу диріхлету, використовувані в моделі LDA. Щоб отримати деяке інтуїтивне розуміння того, як це працює, ця презентація містить кілька приємних ілюстрацій, а також хороше пояснення LDA загалом.
Додатковий коментар я викладу тут, оскільки не можу коментувати ваше первісне запитання: з того, що я бачив, альфа- та бета-параметри можуть дещо заплутано відноситись до декількох різних параметрів. Основний розподіл диріхлету зазвичай параметризується вектором , але це може бути розкладено на базову міру та концентрацію параметр , такий, що . У випадку, коли параметр альфа - скалярний, зазвичай мається на увазі параметр концентрації , але він також може означати значення( α1, α2, . . . , αК)u = ( u1, у2, . . . , уК)αα ∗ u = ( α1, α2, . . . , αК)α( α1, α2, . . . , αК), оскільки вони будуть рівні при симетричному розподілі диріхлету. Якщо це вектор, він зазвичай посилається на . Я не впевнений, яка параметризація найбільш поширена, але у своїй відповіді я припускаю, що ви мали на увазі параметри концентрації альфа- та бета-версії.( α1, α2, . . . , αК)