Пояснення Леймана щодо цензури в аналізі виживання


13

Я читав про те, що таке цензура, і як це потрібно враховувати в аналізі виживання, але хотів би почути менш математичне визначення цього і більш інтуїтивне визначення (фотографії були б чудовими!). Чи може хто-небудь надати мені пояснення: 1) цензура та 2) як це впливає на такі речі, як криві Каплана-Меєра та регресія Кокса?


Я пропоную прослухати підкаст Linear Digression про аналіз виживання та почути їх спрощене визначення лівої та правої цензури та мотивацію моделі Кокса.
Урі Горен

Відповіді:


16

Цензура часто описується порівняно із усіченням . Хороший опис двох процесів надають Gelman et al (2005, p. 235):

Обрізані дані відрізняються від цензурованих даних тим, що ніяких підрахунків спостережень за точкою усічення немає. При цензурі значення спостережень за точкою усічення втрачаються, але їх кількість спостерігається.

Цензура чи укорочення можуть відбуватися для значень, що перевищують деякий рівень (права цензура), нижче деякого рівня (лівоцензура) або обидва.

2.02.0

введіть тут опис зображення

Інтуїтивно зрозумілий приклад цензури полягає в тому, що ви запитуєте респондентів про їх вік, але записуєте це лише до деякої цінності, і всі віки вище цієї величини, скажімо, 60 років, записуються як "60+". Це призводить до отримання точної інформації для нецензурованих значень і відсутності інформації про цензуровані значення.

Не настільки типовий приклад цензури в реальному житті спостерігався в балах екзамену з польської матури, який привернув досить багато уваги в інтернеті . Іспит складається в кінці середньої школи, і студенти повинні здати його, щоб мати змогу подати заявку на здобуття вищої освіти. Чи можете ви здогадатися із наведеного нижче сюжету, яка мінімальна кількість балів, яку потрібно отримати студентам, щоб скласти іспит? Не дивно, що "розрив" в нормальному розподілі може бути легко "заповнений", якщо взяти відповідну частку завищених представлених балів трохи вище межі цензури.

введіть тут опис зображення

У разі аналізу виживання

Цензура виникає тоді, коли ми маємо деяку інформацію про індивідуальний час виживання, але ми точно не знаємо час виживання

(Kleinbaum and Klein, 2005, стор. 5). Наприклад, ви лікуєте пацієнтів яким-небудь препаратом і спостерігаєте за ними до кінця дослідження, але ви не знаєте, що з ними відбувається після закінчення дослідження (чи були рецидиви чи побічні ефекти?), Єдине, що вам відомо, це те, що вони " вижили " принаймні до кінця дослідження.

Нижче ви можете знайти приклад даних, згенерованих з розподілу Weibull, змодельованого за допомогою оцінювача Kaplan – Meier. Модель синьої кривої позначки оцінюється за повним набором даних, на середньому графіку ви бачите цензуровану вибірку та модель, оцінену за цензурованими даними (червона крива), праворуч ви бачите усічений зразок та модель, оцінену за таким зразком (червона крива). Як бачимо, відсутні дані (усічення) мають істотний вплив на оцінки, але цензуру можна легко управляти за допомогою стандартних моделей аналізу виживання.

введіть тут опис зображення

Це не означає, що ви не можете аналізувати усічені зразки, але в таких випадках вам доведеться використовувати моделі для відсутніх даних, які намагаються «відгадати» невідому інформацію.


Kleinbaum, DG та Klein, M. (2005). Аналіз виживання: текст самостійного навчання. Спрингер.

Гельман, А., Карлін, Дж. Б., Стерн, Х. С., і Рубін, Д. Б. (2005). Байєсівський аналіз даних. Chapman & Hall / CRC.


Чи знаєте ви, звідки походить цей сюжет матури? Я спробував googling і продовжував отримувати посилання reddit, але це не містить посилань. Це просто призводить до imgur.com без жодних атрибуцій. ОНОВЛЕННЯ: Знайдено. cke.edu.pl//images/files/matura/informacje_o_wynikach/2013/… стор. 18.
каже Відновити Моніку

1
@amoeba, якщо вас зацікавили подальші деталі, не соромтесь зв’язатися зі мною. Більшість матеріалів на цю тему, які я знаю, на жаль, польською мовою. Зображення - це одне, але мій друг зробив більш детальний аналіз цих даних (btw, він доступний за запитом).
Тім

2

Цензура є ключовою в аналізі виживання.

Основна ідея полягає в тому, що інформація цензурована, вона вам непомітна. Простіше пояснимо, цензурований розподіл часу життя виходить, якщо ви реєструєте часи життя, перш ніж усі в зразку померли. Якщо ви думаєте про час переміщення «вправо» по осі X, це можна назвати правоцензурною.

Існують також інші типи: цензура зліва та цензура вікон. Дивіться, наприклад, текст Еллісона 1984 року про Аналіз історії подій, опублікований Sage для повчального вступу.

Приклад: Якщо ви розраховуєте коефіцієнти розлучень серед населення, ви хочете включити лише осіб, яким загрожує розлучення (тобто вони одружені). Якщо люди припиняють шлюб з інших причин, ніж розлучення (побоювання, анулювання), ви хочете цензуру. Їм вже не загрожує розлучення. Ваші оцінки (і сюжети) Каплана-Мейєра не повинні включати цензуровані спостереження після моменту, коли вони цензуруються, а повинні включати їх до цього моменту.


Графіка чи сюжети?
RustyStatistician
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.