Чому додавання ефекту відставання означає середнє відхилення в ієрархічній моделі Баєса?


14

Передумови: Зараз я виконую деяку роботу, порівнюючи різні ієрархічні моделі Баєса. Дані це числові показники добробуту для учасника i та часу j . У мене близько 1000 учасників і від 5 до 10 спостережень на кожного учасника.уijij

Як і у більшості поздовжніх наборів даних, я очікую побачити певну форму автокореляції, завдяки якій спостереження, що знаходяться ближче за часом, мають більшу кореляцію, ніж ті, що знаходяться далі. Спрощуючи кілька речей, основна модель полягає в наступному:

уijN(мкij,σ2)

де я порівнюю модель без відставання:

мкij=β0i

з моделлю відставання:

мкij=β0i+β1(уi(j-1)-β0i)

де - середній рівень людини іβ0i - параметр відставання (тобто ефект відставання додає кратне відхилення спостереження від попередньої часової точки від прогнозованого значення цієї часової точки). Я також повинен був зробити кілька речей, щоб оцінити y i 0 (тобто спостереження до першого спостереження).β1уi0

Результати, які я отримую, свідчать про те, що:

  • Параметр відставання становить близько .18, 95% CI [.14, .21]. Тобто це не нуль
  • Середнє відхилення і ДВЗ збільшуються на кілька сотень, коли відставання включено в модель
  • Задні прогнозні перевірки показують, що, включаючи ефект відставання, модель краще здатна відновити автокореляцію в даних

Отже, підсумовуючи, ненульовий параметр відставання та задні передбачувальні перевірки свідчать про те, що модель відставання є кращою; але середнє відхилення та DIC припускають, що модель без відставання є кращою. Це мене спантеличує.

Мій загальний досвід полягає в тому, що якщо ви додасте корисний параметр, він повинен хоча б зменшити середнє відхилення (навіть якщо після штрафу за складність DIC не покращиться). Крім того, значення нуля для параметра відставання досягне такого ж відхилення, що і для моделі відставання.

Питання

Чому додавання ефекту відставання може збільшити середнє відхилення в ієрархічній моделі Байєса, навіть якщо параметр відставання не дорівнює нулю, і це покращує задні прогнозні перевірки?

Початкові думки

  • Я зробив багато перевірок на конвергенцію (наприклад, дивлячись на трекплотти; вивчаючи зміни результатів відхилення в ланцюгах і поперек), і обидві моделі, схоже, сходилися на задній частині.
  • Я зробив перевірку коду, де я змусив ефект відставання дорівнювати нулю, і це відновило відхилення моделі відставання.
  • Я також розглянув середнє відхилення за мінусом штрафу, яке повинно дати відхилення при очікуваних значеннях, і це також зробило модель відставання гіршою.
  • Можливо, ефект відставання зменшує ефективну кількість спостережень на людину, що знижує впевненість в оцінці засобів рівня людини ( β0i ), що збільшує відхилення.
  • Можливо, є якесь питання щодо того, як я оцінив передбачуваний момент часу до першого спостереження.
  • Можливо, ефект відставання у цих даних просто слабкий
  • Я спробував оцінити модель , використовуючи максимальну liklihood , використовуючи lmeз correlation=corAR1(). Оцінка параметра відставання була дуже схожа. У цьому випадку модель відставання мала більшу ймовірність журналу та менший AIC (приблизно на 100), ніж одна без відставання (тобто, це припускає, що модель відставання є кращою). Тож це посилило думку про те, що додавання відставання також має зменшити відхилення в байєсівській моделі.
  • Можливо, є щось особливе в залишках Байєса. Якщо модель відставання використовує різницю між передбачуваним та фактичним y у попередньому моменті, то ця кількість буде невизначеною. Таким чином, ефект відставання буде діяти через надійний інтервал таких залишкових значень.

Ви кажете, що параметр відставання становить близько .18. Ви дізналися лага-параметр? Якщо так, то що раніше ви використовували?
Саміт

N(β0i,σ2)

Відповіді:


1

Ось мої думки:

  • Замість DIC, BIC, AIC я пропоную безпосередньо працювати з граничною ймовірністю (також відомою як докази ), якщо ви можете собі це дозволити. Чим більше доказів , тим більше шансів на ваш модельний клас. Це може не мати великої різниці, але DIC, BIC, AIC - це, зрештою, лише наближення.
  • 0,18
  • Пойдемо на крок далі: візьміть модель, яка не враховує відставання (с), і обчисліть її граничну ймовірність . Далі візьміть свій клас класу (d), який включає в себе затримку та має пріоритет на параметр lag; обчислити граничну ймовірність (d). Можна було б очікувати, що (d) має більшу граничну ймовірність . То що, якщо ви цього не зробите?

    (1) Гранична ймовірність розглядає модельний клас в цілому. Сюди входить ефект відставання, кількість параметрів, ймовірність, попереднє.

    (2) Порівняння моделей, що мають різну кількість параметрів, завжди делікатне, якщо існує значна невизначеність у попередніх додаткових параметрах.

    (3) Якщо ви визначите невизначеність у попередньому вашому лаг-параметрі нерозумно великим, ви штрафуєте весь клас моделі.

    (4) Яка інформація, яка підтримує однакові ймовірності як для негативних відстань, так і для позитивних? Я вважаю, що навряд чи можна спостерігати негативне відставання, і це слід враховувати в попередньому.

    (5) Попередня, яку ви обрали у своєму лага-параметрі, є рівномірною. Зазвичай це ніколи не є вдалим вибором: Ви абсолютно впевнені, що ваші параметри повинні дійсно лежати у визначених межах? Чи дійсно кожне відставання у межах меж має однакову ймовірність? Моя пропозиція: перейдіть за допомогою бета-розподілу (якщо ви впевнені, що відставання обмежено; або з log-нормалом, якщо ви можете виключити значення, менші за нуль .

    (6) Це конкретний приклад, коли використання неінформативних пріорів не є добрим (дивлячись на граничну ймовірність ): Ви завжди будете віддавати перевагу моделі, яка має меншу кількість невизначених параметрів; не важливо, наскільки добре чи погано могла б зробити модель з більшою кількістю параметрів.

Я сподіваюся, що мої думки дадуть вам нові ідеї, підказки ?!


Дякую за поради. Просто для округлення речей я намагався обмежити параметр відставання, щоб мати значення середнього заднього (тобто 0,18). Модель без відставання все ж мала менший середній відхилення.
Джеромі Англім
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.