Відповідність балів схильності після багаторазової імпутації


34

Я посилаюся на цей документ: Hayes JR, Groner JI. "Використання декількох оцінок імпутації та схильності для тестування впливу автомобільних сидінь та ременів безпеки на ступінь тяжкості травми, отриманої за даними реєстру травм." J Педіатр Сурґ. 2008 р., 43 (5): 924–7.

У цьому дослідженні було проведено багаторазову імпутацію для отримання 15 повних наборів даних. Оцінки схильності потім були обчислені для кожного набору даних. Потім для кожної оглядової одиниці був обраний запис випадковим чином з одного із завершених 15 наборів даних (включаючи відповідний показник схильності), таким чином створивши єдиний кінцевий набір даних, для якого потім був проаналізований відповідність оцінки схильності.

Мої запитання: чи це вірний спосіб співставити показник схильності після багаторазової імпутації? Чи є альтернативні способи це зробити?

Для контексту: У своєму новому проекті я прагну порівняти ефекти двох методів лікування, використовуючи відповідність показників схильності. Є відсутні дані, і я маю намір використовувати MICEпакет в R для імпультування пропущених значень, потім twangдля порівняння шкали схильності, а потім lme4для аналізу зіставлених даних.

Оновлення1:

Я знайшов цей документ, який застосовує інший підхід: Мітра, Робін та Рейтер, Джером П. (2011). Схильність шкали, що відповідає відсутнім коваріатам, через ітераційну послідовну кратну імпутацію [Робочий документ]

У цій роботі автори обчислюють бали схильності для всіх імпутованих наборів даних, а потім об'єднують їх шляхом усереднення, що є в дусі багаторазової імпутації, використовуючи правило Рубіна для бального оцінювання - але чи реально це застосувати для оцінки схильності?

Було б дуже приємно, якби хтось із резюме міг надати відповідь з коментарями до цих двох різних підходів та / або будь-яких інших ....

Відповіді:


20

Перше, що слід сказати, це те, що для мене метод 1 (вибірки), здається, не має великої заслуги - він відкидає переваги багаторазової імпутації та зводиться до одиничної імпутації для кожного спостереження, про що згадував Стас. Я не бачу жодної переваги в його використанні.

Проводиться відмінне обговорення питань, пов’язаних з аналізом оцінки схильності з відсутніми даними в Хіллі (2004): Hill, J. "Зменшення ухилу в оцінці ефекту від лікування в обсерваційних дослідженнях, що страждають від відсутніх даних" Робочі документи ISERP, 2004, які можна завантажити з тут .

У статті розглядаються два підходи до використання багаторазової імпутації (а також інші методи поводження з відсутніми даними) та показники схильності:

  • усереднення балів схильності після багаторазової імпутації з подальшим причинним висновком (метод 2 у вашому дописі вище)

  • каузальне виведення з використанням кожного набору схильності оцінюється з декількох імпутацій з подальшим усередненням причинних оцінок.

Крім того, у статті розглядається питання про те, чи слід включати результат як прогноктор в модель імпутації.

Хілл стверджує, що хоча кратна імпутація віддається перевагу іншим методам поводження з відсутніми даними, загалом немає апріоріпричина віддати перевагу одній з цих методик над іншою. Однак можуть бути причини віддати перевагу усередненню показників схильності, особливо при використанні певних алгоритмів відповідності. У цьому ж документі Хілл провів дослідження імітаційного моделювання і виявив, що усереднення балів схильності до каузального висновку, коли включення результату в модель імпутації дало найкращі результати за середньою квадратичною помилкою та першим усередненням балів, але без результату в моделі імпутації дали найкращі результати за середнім зміщенням (абсолютна різниця між оцінним та справжнім ефектом лікування). Як правило, доцільно включити результат в модель імпутації (наприклад, дивіться тут ).

Тому, здавалося б, ваш спосіб 2 - це шлях.


1
Я розумію метод №2, але я в загрозі того, як його реалізувати в Р. Хтось має посилання на мене?
Сам

2
Код R для обох методів надається у віньєтці для cobaltпакету під назвою "Використання кобальту зі складними даними". Ви можете отримати доступ до нього тут: CRAN.R-project.org/package=cobalt
Ной

13

Можливо, відбудеться зіткнення двох парадигм. Множинна імпутація - байєсівське рішення, що ґрунтується на моделі: концепція належної імпутації по суті стверджує, що вам потрібно взяти вибірку з чітко визначеного заднього розподілу даних, інакше вас накрутили. З іншого боку, відповідність показника схильності - це парапараметрична процедура: після того, як ви обчислили свій показник схильності (незалежно від того, як ви могли використовувати оцінку щільності ядра, а не обов'язково модель Logit), ви можете зробити все інше просто взявши відмінності між обробленими та не обробленими спостереженнями з тим же показником схильності, який зараз як би не параметричний, оскільки не існує моделі, яка контролює інші коваріати. Я не 'Абаді і Імбенс (2008) обговорили, що неможливо реально правильно встановити стандартні помилки в деяких ситуаціях, що відповідають). Я би віддав більше довіри плавнішим підходам, як зважування за зворотною схильністю. Моя улюблена посилання на це - "Здебільшого нешкідливі економетрики" , підзаголовки "Емпіричний супутник", і спрямовані на економістів, але я вважаю, що ця книга повинна бути обов’язковою для читання для інших вчених-соціологів, більшості біостатистів та небіостатистів. що вони знають, як інші дисципліни підходять до аналізу даних.

У будь-якому випадку використання лише одного з 15 модельованих повних рядків даних на спостереження еквівалентно одній імпутації. В результаті ви втрачаєте ефективність порівняно з усіма 15 завершеними наборами даних, і не можете правильно оцінити стандартні помилки. Мені це виглядає як дефіцитна процедура з будь-якого кута.

Звичайно, ми радісно підмітаємо під килимом припущення, що як модель множинної імпутації, так і модель схильності є правильними в сенсі наявності всіх правильних змінних у всіх правильних функціональних формах. Це мало що можна перевірити (хоча я радий почути інакше про діагностичні заходи для обох цих методів).


(+1) Зокрема, я не відчуваю себе добре щодо розривів, введених буквальною реалізацією відповідності (знайдіть контроль з найближчим можливим значенням показника схильності, а ігноруйте решту) . Оцінка схильності завжди так вважала мене досить грубою процедурою.
кардинал

@cardinal, див. оновлення.
Стаск

Насправді я бачив більше критики щодо IPTW, ніж у порівнянні з іншими методами (мені потрібно буде прочитати). Див. Регресії зважування за показниками схильності ( Freedman & Berk, 2008 ), а застосований приклад див. Bjerk, 2009 . Я не зовсім впевнений, чому ви рекомендуєте « Безшкідливу економетрику» у відповідь тут, але це хороша рекомендація для тих, хто цікавиться спостережливими дослідженнями.
Енді Ш

@Andy, фрагмент Freedman & Berk, здається, має справу зі значно простішою ситуацією, коли ти можеш моделювати все в умовах логістичної регресії. Наскільки я розумію, такі методи, як PSM, застосовуються в набагато складніших ситуаціях, коли у вас є багато більше коваріатів, і ви не довіряєте моделі досить добре, щоб вважати, що вона правильно вказана. Вони помітили, що ситуація сприятлива для зважування, але я думаю, що це було сприятливим для моделі порівняно з іншими можливими методами.
StasK

2
Оскільки ваші дані не є ідентичними, і велика теорема максимальної ймовірності про рівність зворотного гессіана та зовнішнього добутку градієнта вже не відповідає, і жодна з них не є послідовною оцінкою відхилень. Потрібно використовувати сендвіч-оцінювач дисперсії, також оцінювач лінеаризації в статистиці опитування, відомий як Білий надійний оцінка в економетриці.
Стаск

10

Я не можу реально говорити з теоретичними аспектами питання, але я передам свій досвід використання моделей PS / IPTW та багаторазової імпутації.

  1. Я ніколи не чув, щоб хтось використовував множинні імпутовані набори даних та випадкову вибірку для створення єдиного набору даних. Це не обов'язково означає, що це неправильно, але це дивний підхід до використання. Набір даних також не є достатньо великим, щоб вам було потрібно займатися творчістю, щоб обійти 3-5 моделей, а не одну, щоб заощадити час та обчислення.
  2. Правило Рубіна та метод об'єднання є досить загальним інструментом. Враховуючи об'єднаний, багаторазово введений результат можна обчислити, використовуючи лише дисперсію та оцінки, я не маю жодної причини, коли я бачу, що він не міг бути використаний для вашого проекту - створення імпутованих даних, проведення аналізу на кожному наборі, а потім об'єднання. Це те, що я зробив, це те, що я бачив, і якщо ви не маєте конкретного обгрунтування цього не робити, я не можу реально побачити причину йти з чимось більш екзотичним, особливо якщо ви не розумієте, що робити продовження методу.

+1 Це питання, на який важко дати хорошу відповідь, оскільки, здається, такий вузькоспеціалізований документ. Але крім того, що заявляє про втрату винагороди за попереднім аналогічним питанням, ОП додала питання, яке благало рішення, яке було перенесено на мета. Я зробив подібні коментарі до ваших у своїй відповіді. Я особливо сумнівно ставлюсь до вибірки з множинного набору даних.
Майкл Р. Черник

Спасибі ! Чи є у вас посилання на те, де використовується метод 2?
Джо Кінг

@JoeKing Сумно, не з голови.
Фоміт
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.