Я працюю над великомірною задачею висновку (близько 2000 параметрів моделі), для якої ми можемо надійно виконати оцінку MAP, знайшовши глобальний максимум журналу заднього за допомогою комбінації оптимізації на основі градієнта та генетичного алгоритму.
Я дуже хотів би мати можливість зробити деяку оцінку невизначеностей щодо параметрів моделі на додаток до знаходження оцінки ПДЧ.
Ми можемо ефективно обчислити градієнт log-posterior щодо параметрів, тому в довгостроковій перспективі ми прагнемо використовувати Hamiltonian MCMC для певної вибірки, але наразі мене цікавлять оцінки, що не ґрунтуються на вибірці.
Єдиний підхід, про який я знаю, - це обчислити інверсію Гессіана в режимі наближення заднього як багатофакторний нормальний, але навіть це здається нездійсненним для такої великої системи, оскільки навіть якщо ми обчислимо елементи Гессі Я впевнений, що ми не змогли знайти його зворотну сторону.
Хтось може підказати, які типи підходів використовуються у таких випадках?
Дякую!
EDIT - додаткова інформація про проблему
Передумови
Це зворотна проблема, пов'язана з великим фізичним експериментом. У нас є 2D трикутна сітка, яка описує деякі фізичні поля, а параметри нашої моделі - це фізичні значення цих полів у кожній вершині сітки. У сітці є близько 650 вершин, і ми моделюємо 3 поля, тож звідси беруться наші 2000 модельних параметрів.
Наші експериментальні дані - це інструменти, які вимірюють ці поля не безпосередньо, а величини, які є складними нелінійними функціями полів. Для кожного з різних інструментів у нас є пряма модель, яка відображає параметри моделі на прогнози експериментальних даних, а порівняння між прогнозуванням та вимірюванням дає ймовірність журналу.
Потім ми підсумовуємо ймовірність журналу з усіх цих різних інструментів, а також додаємо деякі значення попереднього журналу, які застосовують деякі фізичні обмеження до полів.
Отже, я сумніваюся, що ця «модель» акуратно підпадає під категорію - у нас немає вибору, що це за модель, це продиктовано тим, як функціонують фактичні прилади, які збирають наші експериментальні дані.
Набір
даних Набір даних складається з 500x500 зображень, і є по одному зображення для кожної камери, тому загальна кількість даних 500x500x4 = .
Модель помилок
Ми вважаємо, що всі помилки в проблемі мають бути гауссовими на даний момент. У якийсь момент я можу спробувати перейти до моделі помилок студента-т лише для деякої додаткової гнучкості, але все одно, здається, все добре спрацьовує лише з гауссами.
Приклад ймовірності
Це експеримент з фізики плазми, і переважна більшість наших даних надходить з камер, спрямованих на плазму, з окремими фільтрами перед лінзами, щоб дивитись лише на конкретні частини світлового спектру.
Для відтворення даних є два етапи; спочатку ми маємо змоделювати світло, яке надходить із плазми на сітку, потім ми маємо змоделювати це світло назад до зображення камери.
Моделювання світла, яке надходить з плазми, на жаль, залежить від того, які є ефективні коефіцієнти швидкості, які говорять про те, скільки світла випромінюють різні процеси, задані полями. Ці показники прогнозуються деякими дорогими числовими моделями, тому ми повинні зберігати їх вихід на сітках, а потім інтерполювати для пошуку значень. Дані функції швидкості обчислюються лише один раз - ми зберігаємо їх, потім створюємо з неї сплайн, коли запускається код, а потім цей сплайн використовується для всіх оцінок функції.
Припустимо, і є функціями швидкості (яку ми оцінюємо за допомогою інтерполяції), тоді випромінювання в -й вершині mesh задається
де - 3 поля, які ми моделюємо на сітці. Отримати вектор викидів до зображення камери досить просто, це просто множення на матрицю яка кодує, які частини сітки переглядає кожен піксель камери.
Оскільки помилки є Гауссом, то ймовірність журналу для цієї конкретної камери є
де - дані камери. Загальна ймовірність журналу - це сума з 4 вищезазначених виразів, але для різних камер, які мають різні версії функцій швидкості оскільки вони дивляться на різні частини світлового спектру.
Попередній приклад
У нас є різні пріори, які ефективно встановлюють певні верхні та нижні межі в різних кількостях, але вони, як правило, не надто сильно впливають на проблему. У нас є одна попередня дія, яка діє сильно, що ефективно застосовує згладжування лаплаціанського типу до полів. Він також приймає форму Гаусса: