Оцінка ML для експоненціального розподілу (з цензурованими даними)


9

В аналізі виживання ви припускаєте, що час виживання rv буде експоненціально розподілений. Враховуючи тепер, що у мене є "результати" iid rv . Тільки деяка частка цих результатів насправді "повністю реалізована", тобто решта спостережень все ще "живі".Xix1,,xnXi

Якщо я хотів виконати оцінку ML для параметра швидкості розподілу, як я можу використовувати нереалізовані спостереження узгоджено / відповідним чином? Я вважаю, що вони все ще містять корисну інформацію для оцінки.λ

Невже хтось може мене направити на літературу на цю тему? Я впевнений, що він існує. Однак у мене виникають проблеми з пошуку хороших ключових слів / пошукових термінів для цієї теми.


3
Отже, ви говорите, що з випадкових змінних, у яких у вас є вимірювання, скажімо, спостереження представляють "остаточну" тривалість життя (тому що пов'язані випадкові величини були "мертвими" під час вимірювання), а решта спостереження - це тривалість виживання випадкових величин, які були "ще живими" під час вимірювання? ( )nn1<nn2<nn1+n2=n
Алекос Пападопулос

1
це урізана модель, "живі" випадкові величини усікаються в момент припинення спостереження.
Сіань

1
Ознайомтеся з моделями Tobit для усічених даних та пов'язаних з ними джерел (наприклад, тут ).
Річард Харді

2
Ви, здається, маєте цензурні дані, як життя, де деякі люди загинули, але деякі ще живі, такі ви знаєте лише, що, скажімо, для якоїсь відомої постійної . xi>titi
kjetil b halvorsen

3
Остерігайтеся іноді тонкої різниці між двома ситуаціями. Не рідкість урізання плутати за цензуру, і навпаки.
Алекос Пападопулос

Відповіді:


17

Ви все ще можете оцінити параметри, використовуючи ймовірність безпосередньо. Нехай спостереження будуть з експоненціальним розподілом зі швидкістю і невідомими. Функція густини , функція кумулятивного розподілу і хвостова функція . Припустимо, спочатку спостерігаються спостереження, тоді як для ми знаємо лише, що для деяких відомих позитивних константx1,,xnλ>0f(x;λ)=λeλxF(x;λ)=1eλxG(x;λ)=1F(x;λ)=eλxrxr+1,,xnxj>tjtj. Як завжди, для цензурованих спостережень вірогідність - це "ймовірність спостережуваних даних", що задається , тому функція повної ймовірності - Функція вірогідності журналу стає яка має таку ж форму, як імовірність реєстрації для звичайного, повністю спостережуваного випадку, за винятком першого терміна в місце . Записуючи для середнього часу спостережень та цензури, оцінювач максимальної вірогідності стаєP(Xj>tj)=G(tj;λ)

L(λ)=i=1rf(xi;λ)i=r+1nG(tj;λ)
l(λ)=rlogλλ(x1++xr+tr+1++tn)
rlogλnlogλTλλ^=rnT , який ви самі можете порівняти з повністю спостережуваним випадком.
 EDIT   

Щоб спробувати відповісти на запитання в коментарях: Якщо всі спостереження були цензуровані, тобто ми не чекали досить довго, щоб спостерігати якусь подію (смерть), що ми можемо зробити? У цьому випадку , тому ймовірність логліка стає , тобто лінійно зменшується в . Отже, максимум повинен бути для ! Але нуль не є дійсним значенням для параметра швидкості оскільки воно не відповідає жодному експоненціальному розподілу. Потрібно зробити висновок, що в цьому випадку максимального показника ймовірності не існує! Можливо, можна спробувати побудувати якийсь інтервал довіри дляr=0

l(λ)=nTλ
λλ=0λλвиходячи з цієї функції вірогідності? Для цього дивіться нижче.

Але, у будь-якому випадку, справжній висновок з даних у цьому випадку полягає в тому, що нам слід почекати більше часу, поки ми не отримаємо якісь події ...

Ось як ми можемо побудувати (однобічний) довірчий інтервал для у випадку, якщо всі спостереження цензуруються. Імовірною функцією в цьому випадку є , яка має таку ж форму, як ймовірність функції з біноміального експерименту, де ми отримали всі успіхи, а це (див. Також Інтервал довіри навколо двочленної оцінки 0 або 1 ). У цьому випадку ми хочемо одностороннього довірчого інтервалу для форми . Тоді ми отримаємо інтервал для , вирішуючи .λeλnTpnp[p¯,1]λlogp=λT

Отримаємо інтервал довіри для , вирішивши так, що . Це дасть нарешті інтервал довіри для : p

P(X=n)=pn0.95    (say)
nlogplog0.95λ
λlog0.95nT.

1
Читаючи запитання і відповідь, я подумав: "Що, якщо всі спостереження другого типу, для яких ми знаємо лише, що , і спостереження не спостерігалося повністю?" Було б дуже корисно включити цю справу і до вашої відповіді, як розширення. xj>tj
Алекос Пападопулос
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.