Як я можу об'єднати задні засоби та достовірні інтервали після багаторазової імпутації?


20

Я використовував багаторазову імпутацію, щоб отримати ряд завершених наборів даних.

Я використовував байєсівські методи для кожного із завершених наборів даних для отримання заднього розподілу параметра (випадковий ефект).

Як можна об'єднати / об'єднати результати для цього параметра?


Більше контексту:

Моя модель є ієрархічною у розумінні окремих учнів (одне спостереження на одного учня), зібраних у школах. Я зробив кілька імпутацій (використовуючи MICER) для своїх даних, де я включив schoolяк один з прогнозів відсутніх даних - щоб спробувати включити іерархію даних у імпутації.

Я встановив просту модель випадкового нахилу до кожного із завершених наборів даних (використовуючи MCMCglmmR). Результат - двійковий.

Я виявив, що задні густини випадкової дисперсії нахилу "добре поводяться" в тому сенсі, що вони виглядають приблизно так: введіть тут опис зображення

Як я можу поєднувати / об'єднувати задні засоби та достовірні інтервали від кожного введеного набору даних для цього випадкового ефекту?


Оновлення1 :

З того, що я розумію до цих пір, я міг би застосувати правила Рубіна до заднього середнього значення, щоб дати багаторазово вписане заднє значення - чи є проблеми з цим? Але я поняття не маю, як я можу поєднати 95% достовірні інтервали. Крім того, оскільки я маю фактичний зразок задньої щільності для кожної імпутації - чи можу я якось комбінувати їх?


Оновлення2 :

Згідно з пропозицією @ cyan у коментарях, мені дуже подобається ідея просто поєднувати зразки із заднього розподілу, отримані з кожного повного набору даних за рахунок багаторазової імпутації. Однак мені хотілося б знати теоретичне обгрунтування цього.


Якщо відсутність будь-якого даного даного даних не залежить від пов'язаного значення результату, правильно просто зібрати всі задні зразки з різних набірних наборів даних разом і взяти середній та 95% достовірний інтервали комбінованих задніх зразків.
Циан

@Cyan це те саме, що говорити про те, що механізм відсутності або "відсутній випадково", або "повністю відсутній випадково", але не "відсутній не випадково" (звичайні припущення, про які я дізнався для виконання ІМ)? Чи знаєте ви будь-яку посилання, де це "метання разом" виправдане формально?
Джо Кінг

Множинна імпутація є басейською процедурою в її основі. Якщо ви використовуєте байєсівські методи для оцінки (MCMC і подібні), вам слід просто кинути моделювання відсутніх даних як додатковий крок вибірки MCMC для повністю байєсівської моделі, і не буде турбуватися намагатися створити інтерфейс між цими підходами.
Стаск

@StasK дякую за Ваш коментар. Я спробую використовувати такий підхід у своєму наступному проекті, але, на жаль, зараз не встигаю змінити модель. Я вже проводив імпутації та байєсівську модель на кожному імпутованому наборі даних - на її зайняття пішло майже три тижні. Ви вважаєте, що для комбінування задніх зразків мені невірно?
Джо Кінг

Правила Рубіна стосуються лише моментів. Я не знаю, чи можете ви змістовно їх застосувати до розповсюдження. Може бути, може і не бути. Можливо, найкраще, що ви можете зробити, це сказати, що запуск MCMC створив точкові оцінки (задні засоби) та стандартні помилки (задні відхилення), а потім використовувати правила Рубіна для отримання загальної оцінки балів та дисперсії. Ви знаєте, наскільки трагічними можуть бути втрати dfs в ієрархічній моделі та наскільки небезпечним є об'єднання даних: якщо у вас є 5 імпульованих повних наборів даних та 1M зразків MCMC на кожному, це означає, що у вас є 5 кластерів, а не 5M iid MCMC бали.
Стаск

Відповіді:


4

З особливо добре сприйнятими плакатами, які можна адекватно описати параметричним описом розподілу, ви можете просто взяти середнє значення та дисперсію, що найкраще описує вашу задню частину, і піти звідти. Я підозрюю, що це може бути адекватним у багатьох обставинах, коли ти не отримуєш по-справжньому дивних заднього розподілу.


0

Якщо ви використовуєте stata, існує процедура під назвою "mim", яка об'єднує дані після імпутації, використовуючи для моделей зі змішаним ефектом. Я не знаю, чи вона доступна в Р.


Дякую. Я, можливо, не пояснив добре - у мене вже є задні зразки з декількох імпульсованих наборів даних, і я хочу знати, чи можу я просто об'єднати їх, а потім сформувати перемножений імпульований достовірний інтервал?
Джо Кінг
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.