Чи існують швидкі альтернативи алгоритму ЕМ для вивчення моделей із прихованими змінними (особливо pLSA)? Я добре з жертвою точності на користь швидкості.
Чи існують швидкі альтернативи алгоритму ЕМ для вивчення моделей із прихованими змінними (особливо pLSA)? Я добре з жертвою точності на користь швидкості.
Відповіді:
Алгоритми Ньютона-Рафсона часто можна використовувати. Я не знайомий з pSLA, але досить часто застосовується алгоритми Ньютона-Рафсона для моделей латентного класу. Алгоритми Ньютона-Рафсона трохи більше турбують погані початкові значення, ніж ЕМ, тому одна стратегія - спочатку використовувати кілька ітерацій (скажімо, 20) ЕМ, а потім перейти на алгоритм Ньютона-Рафсона. Один алгоритм, з яким я мав великий успіх, це: Чжу, Сійо, Річард Х. Берд, Пейхуанг Лу та Хорхе Ночедал (1997), "Алгоритм 778: L-BFGS-B: Підпрограми Fortran для широкомасштабних обмежених програм. обмежена оптимізація, "Архів ACM на математичному програмному забезпеченні (TOMS), архів 23 (4), 550-60.
Для LDA, "LDA в Інтернеті" є швидкою альтернативою, ніж пакетні методи, наприклад, стандартний EM (http://www.cs.princeton.edu/~blei/papers/HoffmanBleiBach2010b.pdf).
Девід Блей надає програмне забезпечення на своїй сторінці: http://www.cs.princeton.edu/~blei/topicmodeling.html
Ще одна альтернатива, що не згадується у відповідях, - це варіаційні наближення. Хоча ці алгоритми не є точно такими алгоритмами ЕМ у всіх випадках, в деяких випадках алгоритми ЕМ обмежують випадки варіаційних алгоритмів середнього поля Баєса. Ліміт стосується граничного випадку гіперпараметрів, вибір граничних значень - в деяких випадках - дасть вам алгоритм ЕМ.
В будь-якому випадку (алгоритми EM, VB або навіть MM) є два загальних способи прискорити роботу:
(1) зменшити розмірність задачі - від -dim задачі до універсальної задачі . Зазвичай це алгоритми спускання координат, але я бачив алгоритми ММ, які також роблять цей тип прискорення.р
(2) поліпшення швидкості конвергенції вашого алгоритму ЕМ (або іншого типу). У коментарі JohnRos згадав про прискорення Aitken. Це з чисельного світу, але це обговорюється в ЕМ-книзі Маклаклана та Крішнана.
Можливо, є й інші, які я пропустив, але це, здається, два великих.