Чи проводилися широкомасштабні дослідження методів MCMC, які порівнюють продуктивність декількох різних алгоритмів набір тестової щільності? Я маю на увазі щось еквівалентне документу Ріоса та Сахінідіса (2013), який є ретельним порівнянням великої кількості оптимізаторів чорних коробок без похідних у кількох класах тестових функцій.
Для MCMC ефективність може бути оцінена, наприклад, в ефективній кількості зразків (ESS) на оцінку щільності або в іншому відповідному показнику.
Кілька коментарів:
Я розумію, що продуктивність буде сильно залежати від деталей цільового pdf, але аналогічний (можливо, не однаковий) аргумент справедливий для оптимізації, і тим не менш, існує безліч базових функцій, наборів, змагань, робіт тощо, що стосується оптимізації бенчмаркінгу. алгоритми.
Крім того, правда, що MCMC відрізняється від оптимізації тим, що потрібно порівняно набагато більше уваги та налаштування від користувача. Тим не менш, зараз існує декілька методів MCMC, які потребують малої або ніякої настройки: методи, що адаптуються у фазі згоряння, під час вибірки, або багатодержавні (також звані ансамблеві ) методи (наприклад, Emcee ), що еволюціонують декількома взаємодіючими ланцюгами та використовують інформація з інших ланцюгів для направлення вибірки.
Мене особливо цікавить порівняння між стандартними та багатодержавними (ака-ансамблевими) методами. Для визначення багатодержавності див. Розділ 30.6 книги МакКей :
- Це питання виникло звідси .
Оновлення
- Для цікавого заняття методами ансамблевих акаунтів у багатьох штатах дивіться цю публікацію Бба Карпентера в блозі Гельмана, і мій коментар, що стосується цієї публікації в CV.