Яка різниця між частковою ймовірністю, профільною ймовірністю та граничною ймовірністю?


Відповіді:


57

Функція ймовірності зазвичай залежить від багатьох параметрів. Залежно від програми нас зазвичай цікавить лише підмножина цих параметрів. Наприклад, при лінійній регресії інтерес зазвичай лежить у коефіцієнтах нахилу, а не у дисперсії помилок.

Позначимо параметри, які нас цікавлять, як β а параметри, які не є первинними, як θ . Стандартний спосіб підходу до проблеми оцінки полягає в максимізації функції ймовірності, щоб ми отримали оцінки β і θ . Однак, оскільки основний інтерес полягає у β частковій, профільна та гранична ймовірність пропонують альтернативні способи оцінювання β без оцінки θ .

Для того, щоб побачити різницю, позначте стандартну ймовірність через L(β,θ|data) .

Максимальна ймовірність

Знайдіть β і θ які максимізують L(β,θ|data) .

Часткова ймовірність

Якщо ми можемо записати функцію ймовірності як:

L(β,θ|data)=L1(β|data)L2(θ|data)

L1(β|data)

Імовірність профілю

θβθ

θ=g(β)

L(β,g(β)|data)

Гранична ймовірність

θθβ


2
Зауважте, що останнє визначення тут - це інтегрована (або байєсівська) ймовірність, а не гранична ймовірність.
АРС

Чи правильно це в РЗС для часткової ймовірності: "L2 (θ | theta)"?
jpalecek

@ars, будь ласка, відредагуйте відповідь та надайте визначення граничної ймовірності тоді?
Вальдір Леонсіо

13

Усі три використовуються при роботі з параметрами неприємностей у повністю заданій функції ймовірності.

Гранична ймовірність є основним методом усунення неприємних параметрів в теорії. Це справжня функція вірогідності (тобто пропорційна (гранична) ймовірність спостережуваних даних).

Часткова вірогідність взагалі не є справжньою ймовірністю. Однак у деяких випадках це може трактуватися як ймовірність асимптотичного умовиводу. Наприклад, у моделях пропорційної небезпеки Кокса, де вони виникли, нас цікавлять спостережувані ранжирування в даних (T1> T2> ..), не вказуючи базову небезпеку. Ефрон показав, що часткова ймовірність втрачає мало інформації, що не стосується різних функцій небезпеки.

Імовірність профілю зручна, коли ми маємо багатовимірну функцію вірогідності та єдиний цікавий параметр. Він задається шляхом заміни неприємності S на його MLE на кожен фіксований T (параметр, що цікавить), тобто L (T) = L (T, S (T)). Це може спрацювати добре на практиці, хоча можливий ухил у MLE, отриманий таким чином; гранична ймовірність виправляє цю зміщення.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.