У мене є набір даних про випробування на сільському господарстві. Моя змінна відповідь - це коефіцієнт відповіді: log (обробка / контроль). Мене цікавить, що опосередковує різницю, тому я виконую метарегресії RE (не зважені, тому що видається досить зрозумілим, що розмір ефекту не співвідноситься з відхиленням оцінок).
Кожне дослідження повідомляє про урожай зерна, урожай біомаси або те і інше. Я не можу приписати врожай зерна лише в дослідженнях, в яких повідомляється про урожай біомаси, тому що не всі досліджені рослини були корисними для зерна (наприклад, цукровий очерет). Але кожна рослина, яка виробляла зерно, також мала біомасу.
Для відсутніх коваріатів я використовував ітераційну регресійну імпутацію (слідкуючи за підручником Ендрю Гелмана). Це ніби дає розумні результати, і весь процес взагалі інтуїтивно зрозумілий. В основному я прогнозую пропущені значення і використовую ці передбачувані значення для прогнозування відсутніх значень, і переглядаю кожну змінну до тих пір, поки кожна змінна приблизно не зблизиться (у розподілі).
Чи є якась причина, чому я не можу використовувати один і той же процес для імпулювання відсутніх результатів? Я, мабуть, можу сформувати порівняно інформативну модель імпутації щодо співвідношення відгуку на біомасу з урахуванням коефіцієнта відгуку зерна, типу врожаю та інших коваріатів, які у мене є. Тоді я б середній коефіцієнт і VCV, і додати корекцію ІМ, як у стандартній практиці.
Але чим вимірюються ці коефіцієнти, коли самі результати отримані? Чи трактування коефіцієнтів відрізняється від стандартного ІМ для коваріатів? Думаючи про це, я не можу переконати себе, що це не працює, але я не дуже впевнений. Думки та пропозиції щодо читання матеріалу вітаються.