Використання MCMC для оцінки очікуваного значення високовимірної функції


10

Я працюю над дослідницьким проектом, пов’язаним з оптимізацією, і нещодавно виникла ідея використовувати MCMC у цій обстановці. На жаль, я досить новачок у методах MCMC, тому у мене виникло кілька питань. Почну з опису проблеми, а потім задаю свої запитання.

Наша проблема зводиться до оцінки очікуваного значення функції витрат де - -розмірна випадкова величина з щільністю .ω = ( ω 1 , Q , 2 , . . . ω ч ) ч е ( ω )c(ω)ω=(ω1,ω2,...ωh)hf(ω)

У нашому випадку версії із закритою формою не існує. Це означає, що нам доведеться використовувати методи Монте-Карло для наближення очікуваного значення. На жаль, виявляється, що оцінки , які генеруються за допомогою методів MC або QMC, мають занадто велику дисперсію, щоб бути корисною в практичних умовах.E [ c ( ω ) ]c(ω)E[c(ω)]

Одна з думок, що нам довелося використовувати розподіл важливості вибірки для створення точок вибірки, які дадуть низьку оцінку дисперсії . У нашому випадку ідеальне значення розподілу вибірки, , повинно бути приблизно пропорційним . Бачачи, як відомий до постійної величини, мені цікаво, чи можу я використовувати MCMC разом із розподілом пропозиції щоб в кінцевому підсумку генерувати зразки .g ( ω ) c ( ω ) f ( ω ) g ( ω ) c ( ω ) f ( ω ) g ( ω )E[c(ω)]g(ω)c(ω)f(ω)g(ω)c(ω)f(ω)g(ω)

Мої запитання тут:

  • Чи можна використовувати MCMC в рамках цього налаштування? Якщо так, який метод MCMC був би доречним? Я працюю в MATLAB, тому я віддаю перевагу тому, що вже має реалізацію MATLAB.

  • Чи є якісь методи, якими я можу скористатися для прискорення періоду спалювання для MCMC. І як я можу сказати, що стаціонарний розподіл досягнуто? У цьому випадку для обчислення для даної фактично потрібно небагато часу .c(ω)ω


друкарський помилок в останньому абзаці? замість ? c ( w )C(w)c(w)
mpiktas

Не потрібно використовувати методи Монте-Карло для великогабаритних інтегралів лише тому, що закритої форми не існує. Ви могли б використовувати методи , засновані на рідкісних сітках . Я не знаю плюсів і мінусів, хоча сам.
onestop

@onestop - ви праві, рідкісні сітки працюють трохи краще в моєму випадку, хоча я також хотів би перевірити цю ідею.
Берк У.

Це трохи схоже на фінанси.
Вок

1
Це можна застосувати до фінансів. Ми використовуємо це для оптимального управління енергосистемами :)
Berk U.

Відповіді:


4

Я завжди пам’ятаю, що MCMC - це лише інструмент чисельної інтеграції (і досить неефективний). Це не якась магія / містична річ. Це дуже корисно, оскільки його досить просто застосувати. Це не вимагає багато роздумів порівняно з деякими іншими методами чисельної інтеграції. Наприклад, вам не потрібно робити жодних похідних. Вам потрібно генерувати лише "випадкові числа".

Однак, як і будь-який чисельний метод інтеграції, це не універсальний інструмент спіймання всіх. Є умови, коли це корисно, і умови, коли це не так.

Можливо, буде розумніше налаштувати іншу техніку. Залежно від великої і швидкості роботи комп'ютера та скільки часу ви готові чекати результатів. Рівномірна сітка може зробити цю роботу (хоча для цього потрібні невеликі години або велика кількість очікування). "Робота" полягає в оцінці інтеграла - рівняння не байдуже, який сенс ви чи я додаєте до результату (і, отже, не байдуже, отримали ми результат випадковим чином чи ні).hh

Крім того, якщо ваші оцінки досить точні, f ( ω ) буде різко досягнутий пік і буде дуже нагадувати дельта-функцію, тому інтеграл ефективно замінює ω ω m a x .ωf(ω)ωωmax

f(ω)f(ωmax)+(ωωmax)f(ωmax)+12(ωωmax)2f(ωmax)+

Це корисна стратегія, коли моменти легко виходять.ω

У Едвіна Джейнеса приємна цитата на це:

всякий раз, коли існує рандомізований спосіб робити щось, існує не рандомізований спосіб, який дає кращі результати, але вимагає більше мислення

Один з "більш мислячих" способів - використовувати "стратифікований MCMC", щоб зробити інтеграл. Тому замість того, щоб "випадковим чином" вибрати місце на всьому просторі параметрів: розділіть його на "прошарки". Ці "прошарки" слід підібрати так, щоб ви отримали хороший діапазон високої частини інтеграла. Потім вибірково відбирають вибірку в межах кожного шару. Але для цього знадобиться написати власний код, який я б вважав (тобто більше міркував).


Дуже дякую за ваш пост. Мені дуже подобається ваша стратифікована ідея MC. Мені було цікаво, чи знаєте ви про якісь ресурси на ньому, щоб я міг прочитати на ньому? Все, що має приклад в дії, було б дуже вдячно.
Берк У.

Це моя ідея, тому я не знаю жодних ресурсів. Це може бути введено в рамку MCMC, додавши ще один шар, який визначає страти. І однією з моїх головних слабкостей є те, що я роблю - я по душі мислитель! Я знаю, що це вам не дуже допомагає, і вибачаюся за це. Але напевно я не єдина людина, яка думала про це. Кожен, хто робив "проектну" статистику та "байєсівську статистику", напевно, подумав би про це.
ймовірністьіслогічного

2

Немає жодних ознак того, що ваші змінні тут корелюють, тому я не знаю, чому б ви використовували MCMC на відміну від звичайного Монте-Карло. Існує багато різних методів відбору проб, включаючи згаданий стратифікований відбір проб (латинська гіперкуба) та QMC. Методи розрідженої квадратури дуже хороші, якщо розмірність задачі не надто висока (не більше 10), оскільки розрізнені квадратурні сітки ростуть геометрично (прокляття розмірності).

Але це здається, що ви на правильному шляху щодо важливості вибірки. Ключовим тут є вибір упередженого розподілу, який має велику ймовірність, зосереджений поблизу вашого регіону, що цікавить, і який має більш товсті хвости, ніж номінальний розподіл.

Я хотів би додати, що це відкрита дослідницька проблема, тому, якщо ви можете придумати щось хороше, це зацікавило б громаду!


Дякую за це! Чи можете ви детальніше розглянути детальніше про взаємозв'язок між ефективністю MCMC та співвідношенням між змінними? Я завжди думав, що MCMC надасть перевагу перед існуючими методами чисельної інтеграції, коли змінні співвідносяться - хоча я не можу надати вагомих причин, чому це буде.
Берк У.

0

Оскільки, схоже, ніхто не відповідає безпосередньо на питання: так, ви можете використовувати MCMC для вибірки з . MCMC можна використовувати для вибірки з будь-якого розподілу, де розподіл відомий лише до постійної пропорційності.g(ω)

Крім того, ви можете шукати методи зменшення дисперсії у полі інтеграції MC. Чудовим набором ресурсів є безкоштовні розділи книг, доступні від Art Owen у Стенфорді. Зокрема, глави 8, 9 та 10.

Там ви знайдете поглиблене лікування адаптивного відбору проб, рекурсії та інших методик.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.