Реалізація: Пакет теми моделей надає інтерфейс до кодів GSL C та C ++ для моделей тем Blei et al. та Phan та ін. Для більш раннього він використовує Variational EM, для останнього Gibbs Sampling. Див. Http://www.jstatsoft.org/v40/i13/paper . Пакет добре працює з утилітами з пакету tm.
У пакеті lda використовується згорнутий пробовідбірник Gibbs для ряду моделей, подібних до моделей з бібліотеки GSL. Однак він був реалізований самими авторами пакунків, а не Blei et al. Таким чином, ця реалізація в цілому відрізняється від методики оцінки, запропонованої в оригінальних роботах, що представляють ці варіанти моделей, де зазвичай застосовується алгоритм VEM. З іншого боку, пакет пропонує більше функціоналу, ніж інший пакет. Пакет також забезпечує функцію пошуку тексту.
Розширюваність: Що стосується розширюваності, код модельної теми за своєю суттю може бути розширений для інтерфейсу іншого коду моделі теми, написаного на C та C ++. Пакет lda, здається, більше покладається на конкретну реалізацію, яку надають автори, але там, де пробовідбірник Гіббса може дозволити вказати власну тематичну модель. Що стосується питань розширення без користі, перший ліцензується під GPL-2, а останній LGPL, тому це може залежати від того, для чого вам потрібно його продовжити (GPL-2 суворіше щодо аспекту відкритого коду, тобто ви не можете його використовувати у власному програмному забезпеченні).
Продуктивність: Я не можу вам тут допомогти, до цього часу я використовував лише тематичні моделі.
Висновок:
Особисто я використовую topicmodels
, як це добре задокументовано (див. Статтю JSS вище), і я довіряю авторам (Grün також реалізував flexmix, а Hornik є основним членом R).