Запобігання відбору зразків важливої ​​важливості Pareto (PSIS-LOO) не виходить з ладу


10

Нещодавно я почав використовувати випробування з виборкою важливістю Pareto важливої ​​вибіркової перехресної перевірки (PSIS-LOO), описаної в цих роботах:

  • Vehtari, A., & Gelman, A. (2015). Парето вирівнював важливість вибірки. додрук arXiv ( посилання ).
  • Vehtari, A., Gelman, A., & Gabry, J. (2016). Практичне оцінювання байесівської моделі з використанням перехресної валідації "відключення" та "WAIC". додрук arXiv ( посилання )

Це являє собою дуже привабливий підхід до оцінки зразкової моделі, оскільки він дозволяє виконувати LOO-CV з одним циклом MCMC, і він нібито кращий, ніж існуючі інформаційні критерії, такі як WAIC.

PSIS-LOO має діагностику, щоб визначити, чи є наближення надійним, а саме заданими показниками розподілів Парето, пристосованими до хвостів емпіричних розподілів важливих ваг (одна вага на точку даних). Якщо коротко, якщо розрахункова вага , погані речі можуть трапитися.k^ik^i0.7

На жаль, я виявив, що в застосуванні цього методу до моєї проблеми для більшості моделей, які цікавлять, я знаходжу, що велика частка k^i0.7 . Не дивно, що деякі з повідомлених імовірностей журналів LOO були явно безглуздими (порівняно з іншими наборами даних). В якості подвійної перевірки я здійснив традиційну (і багато часу) перехресну перевірку, виявивши, що дійсно у вищенаведеному випадку PSIS-LOO давав жахливі помилкові результати (вгору результати дуже добре узгоджуються з 10 -складне резюме для моделей, у яких всі k^i0.7 ). Для запису я використовую реалізацію MATLAB PSIS-LOO від Aki Vehtari.

Можливо, мені просто не пощастило в тому, що моя поточна і перша проблема, в якій я застосовую цей метод, "складна" для PSIS-LOO, але я підозрюю, що цей випадок може бути відносно поширеним. У таких випадках, як моя, папір для автомобілів, Gelman & Gabry просто говорить:

Навіть якщо оцінка PSIS має кінцеву дисперсію, коли , користувач повинен розглянути вибірку безпосередньо з для проблематичного , використовувати кратну перехресну- валідація або використовувати більш надійну модель.k^>0.7p(θs|yi)ik

Це очевидні, але не дуже ідеальні рішення, оскільки вони вимагають багато часу або потребують додаткового підбору (я вдячний, що MCMC та оцінка моделі стосуються лише неповторної роботи, але чим менше, тим краще).

Чи є якийсь загальний метод, який ми можемо застосувати заздалегідь, щоб спробувати запобігти виходу з ладу PSIS-LOO? У мене є кілька орієнтовних ідей, але мені цікаво, чи вже є емпіричне рішення, яке люди приймають.

Відповіді:


8

Для запису я розмістив аналогічне запитання до списку розсилки користувачів Stan , яке ви можете знайти тут . На мене відповіли один з авторів оригінального документу PSIS-LOO та інші автори проекту Stan. Далі йде моє особисте резюме.

Коротка відповідь полягає в тому, що невідомі загальні методи запобігання виходу з ладу PSIS-LOO. Якщо PSIS-LOO виходить з ладу, це зазвичай тому, що модель має проблеми , і виправлення її обов'язково залишається користувачеві.

Зокрема, причина, через яку PSIS-LOO може вийти з ладу, зазвичай полягає в тому, що одна або кілька дистрибутивів LOO зміщені та / або ширші, ніж повна задня частина, ймовірно, завдяки впливовим спостереженням, і важливість вибіркового розподілу руйнується до однієї або кількох точок.

Я думав, що ви можете спробувати застосувати якусь форму паралельного заднього загартовування, щоб вирішити це питання. Ідея не обов'язково помилкова, але мені було зазначено, що:

  • заднє загартування підручника все ще потребує великої кількості підстав для конкретного випадку, щоб знайти правильний рівень температури, оскільки немає очевидного і невідомого способу зробити це (до речі, з цієї причини Стен не включає паралельне загартування);
  • якщо ви використовуєте більше двох рівнів температури (оскільки може знадобитися надійний підхід), остаточна обчислювальна вартість наближається до перехресної валідації K-кратного або запуску MCMC на проблемних розподілах LOO.

Якщо коротко, якщо PSIS-LOO виходить з ладу, здається, що важко отримати метод, такий же надійний і загальний, як і інші прості патчі; ось чому Vehtari, Gelman & Gabry запропонували такі методи згідно з цитатою, яку я розмістив у своєму первісному запитанні.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.