Передумови: Зараз я виконую деяку роботу, порівнюючи різні ієрархічні моделі Баєса. Дані це числові показники добробуту для учасника i та часу j . У мене близько 1000 учасників і від 5 до 10 спостережень на кожного учасника.
Як і у більшості поздовжніх наборів даних, я очікую побачити певну форму автокореляції, завдяки якій спостереження, що знаходяться ближче за часом, мають більшу кореляцію, ніж ті, що знаходяться далі. Спрощуючи кілька речей, основна модель полягає в наступному:
де я порівнюю модель без відставання:
з моделлю відставання:
де - середній рівень людини і - параметр відставання (тобто ефект відставання додає кратне відхилення спостереження від попередньої часової точки від прогнозованого значення цієї часової точки). Я також повинен був зробити кілька речей, щоб оцінити y i 0 (тобто спостереження до першого спостереження).
Результати, які я отримую, свідчать про те, що:
- Параметр відставання становить близько .18, 95% CI [.14, .21]. Тобто це не нуль
- Середнє відхилення і ДВЗ збільшуються на кілька сотень, коли відставання включено в модель
- Задні прогнозні перевірки показують, що, включаючи ефект відставання, модель краще здатна відновити автокореляцію в даних
Отже, підсумовуючи, ненульовий параметр відставання та задні передбачувальні перевірки свідчать про те, що модель відставання є кращою; але середнє відхилення та DIC припускають, що модель без відставання є кращою. Це мене спантеличує.
Мій загальний досвід полягає в тому, що якщо ви додасте корисний параметр, він повинен хоча б зменшити середнє відхилення (навіть якщо після штрафу за складність DIC не покращиться). Крім того, значення нуля для параметра відставання досягне такого ж відхилення, що і для моделі відставання.
Питання
Чому додавання ефекту відставання може збільшити середнє відхилення в ієрархічній моделі Байєса, навіть якщо параметр відставання не дорівнює нулю, і це покращує задні прогнозні перевірки?
Початкові думки
- Я зробив багато перевірок на конвергенцію (наприклад, дивлячись на трекплотти; вивчаючи зміни результатів відхилення в ланцюгах і поперек), і обидві моделі, схоже, сходилися на задній частині.
- Я зробив перевірку коду, де я змусив ефект відставання дорівнювати нулю, і це відновило відхилення моделі відставання.
- Я також розглянув середнє відхилення за мінусом штрафу, яке повинно дати відхилення при очікуваних значеннях, і це також зробило модель відставання гіршою.
- Можливо, ефект відставання зменшує ефективну кількість спостережень на людину, що знижує впевненість в оцінці засобів рівня людини ( ), що збільшує відхилення.
- Можливо, є якесь питання щодо того, як я оцінив передбачуваний момент часу до першого спостереження.
- Можливо, ефект відставання у цих даних просто слабкий
- Я спробував оцінити модель , використовуючи максимальну liklihood , використовуючи
lme
зcorrelation=corAR1()
. Оцінка параметра відставання була дуже схожа. У цьому випадку модель відставання мала більшу ймовірність журналу та менший AIC (приблизно на 100), ніж одна без відставання (тобто, це припускає, що модель відставання є кращою). Тож це посилило думку про те, що додавання відставання також має зменшити відхилення в байєсівській моделі. - Можливо, є щось особливе в залишках Байєса. Якщо модель відставання використовує різницю між передбачуваним та фактичним y у попередньому моменті, то ця кількість буде невизначеною. Таким чином, ефект відставання буде діяти через надійний інтервал таких залишкових значень.