Модель випадкових ефектів, що обробляє надлишки


9

Я намагаюся розібратися з аналізом часу до події, використовуючи повторні двійкові результати. Припустимо, що час до події вимірюється днями, але на даний момент ми дискретизуємо час на тижні. Я хочу наблизити оцінювач Каплана-Мейєра (але дозволити коваріати), використовуючи повторні двійкові результати. Це здасться оборотним шляхом, але я досліджую, як це поширюється на порядкові результати та періодичні події.

Якщо ви створили двійкову послідовність, яка виглядає як 000 для когось, піддану цензурі на 3 тижні, 0000 для когось, піддану цензурі на 4w, і 0000111111111111 .... для суб'єкта, який не вдався до 5w (значення 1 поширюється на точку, в якій останній предмет був слідуючи в дослідженні), підраховуючи певні тижні пропорції 1s, ви можете отримати звичайні кумулятивні випадки (до тих пір, поки ви не досягнете змінних часових цензур, де це лише наближається, але не дорівнює оцінкам сукупності захворюваності Каплана-Мейєра).

Я можу відповідати повторним бінарним спостереженням з бінарною логістичною моделлю за допомогою GEE, замість того, щоб робити дискретний час, як зазначено вище, але замість того, щоб використовувати сплайн у часі. Оцінювач коваріації сендвіч кластера працює досить добре. Але я хотів би отримати більш точний висновок, використовуючи модель змішаних ефектів. Проблема полягає в тому, що значення 1 після першого 1 є зайвими. Хтось знає про спосіб вказати випадкові ефекти або вказати модель, яка враховує надмірності, щоб стандартні помилки не спущувалися?

Зауважте, що ця установка відрізняється від Ефрона тим, що він використовував логістичні моделі для оцінки умовних ймовірностей у наборах ризиків. Я оцінюю безумовні ймовірності.

Відповіді:


3

Наскільки я можу бачити як з GEE, так і зі змішаною моделлю для повторних бінарних спостережень, у вас виникне проблема, що модель призначить позитивну ймовірність для "0" після того, як було помічено перше "1".

У будь-якому випадку, враховуючи, що ви хочете отримати оцінки з логістичної регресії зі змішаними ефектами, яка буде мати таку ж інтерпретацію, як і в GEE (див. Тут для отримання додаткової інформації), ви можете підігнати модель, використовуючи mixed_model()функцію з пакету GLMMadaptive , а потім використання marginal_coefs(). Приклад дивіться тут .


1
Дякую, Димитріс. У моєму випадку із надмірними значеннями 1 (щоб отримати значення середньої функції), я думаю, мені знадобиться модифікована модель або дивна установка випадкових ефектів. GLMMadaptiveПакет виглядає приголомшливо для більш загальної установки.
Френк Харрелл

2

Пара думок з цього приводу:

  1. Схоже, що модель із змішаним ефектом є принципово «умовною» моделлю ймовірності, тобто якою є ймовірність події для суб'єкта, який загрожує цією подією.

  2. Ми знаємо, що ймовірність "1" після першого "1" є одна. Таким чином, додаткової інформації в наступних значеннях "1" немає.

  3. Схоже, що, оскільки наступні значення "1" не містять додаткової інформації, вони не повинні впливати на функцію ймовірності, а отже, не мати впливу на стандартні помилки оцінювачів, заснованих на ймовірності, а також на самі оцінки. Дійсно, наступні значення "1" не матимуть впливу, якщо p (y = '1' | x) = 1, незалежно від значень параметрів моделі, як це має бути.

  4. Ми можемо бути в змозі змусити цю поведінку (тобто, p (y = '1' | x) = 1) і зберегти бажану середню функцію, додавши індикатор-ковариант до моделі, що позначає наступні, і примусивши його коефіцієнт бути дуже великим, щоб ефективно p (y = '1' | x) = 1.

  5. Як ви вже згадували, також може бути спосіб змусити першу "1" та наступні відповіді на 100% співвідношення. Але у біноміальній моделі це те саме, що p (y = '1' | x) = 1 для наступних відповідей.


1
Дякую Метт. Якщо я не хотів повної моделі, але був задоволений оцінкою рівнянь, то, що ви отримуєте, - додавання дублюючих відповідей до функції оцінки, щоб отримати середню функцію правильно, але не додавати їх до інформаційної функції. Я не думаю, що я можу додати показник коваріату, тому що це спричинить, наприклад, ефект від лікування. Я вважаю модель змішаного ефекту більшою мірою безумовною моделлю. Якщо подія не є поглинаючим станом, ви моделюєте граничні ефекти у залежності від часу.
Френк Харрелл

1

Я не точно впевнений, що ви намагаєтеся зробити, але чи можете ви підібрати об'єднану модель логістичної регресії ( https://www.ncbi.nlm.nih.gov/pubmed/2281238 )? У цьому випадку ви б включили лише 1 протягом інтервалу термінальної події - він не повториться після події. Ви б гнучко включали час у модель (наприклад, розширювали за допомогою сплайнів).


1
Ей Брайан - Мені дуже подобається об'єднана логістична регресія і я часто її використовую. Але якщо ви припините спостереження суб'єкта за термінальною подією, а інші суб'єкти слідкують за цією точкою без події, ви отримаєте неправильну функцію (P (подія за часом t)). Хочу отримати принаймні сумарні оцінки захворюваності середньої функції Каплана-Мейєра принаймні в особливих випадках.
Френк Харрелл
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.