Який взаємозв'язок між розподілом Beta та логістичною регресійною моделлю?


16

Моє запитання: Який математичний зв’язок між розподілом Beta та коефіцієнтами логістичної регресійної моделі ?

Для ілюстрації: логістична (сигмоїдна) функція задана

f(x)=11+exp(x)

і використовується для моделювання ймовірностей в моделі логістичної регресії. Нехай A - дихотомічний (0,1) результат і X - матриця проектування. Модель логістичної регресії задана методом

P(A=1|X)=f(Xβ).

Примітка має перший стовпчик постійної 1 (перехоплення), а β - вектор стовпців коефіцієнтів регресії. Наприклад, коли у нас є один (стандартно-нормальний) регресор x і вибираємо β 0 = 1 (перехоплення) і β 1 = 1 , ми можемо імітувати отриманий "розподіл ймовірностей".X1βxβ0=1β1=1

Гістограма P (A = 1 | X)

Цей сюжет нагадує бета-розподіл (як це роблять графіки для інших варіантів ), щільність якого заданаβ

g(y;p,q)=Γ(p)Γ(q)Γ(p+q)y(p1)(1y)(q1).

Використовуючи максимальну ймовірність або методи моментів , можна оцінити і q з розподілу P ( A = 1 | X ) . Таким чином, моє запитання зводиться до: який взаємозв'язок між варіантами β і p і q ? Для початку, це стосується наведеного вище двозначного випадку.pqP(A=1|X)βpq


Мені це було просто цікаво 3 години тому в моєму байєсівському класі статистики
алхіміку

Відповіді:


16

Бета - це розподіл значень у діапазоні, який є дуже гнучким за своєю формою, тому майже для будь-якого одномовного емпіричного розподілу значень у ( 0 , 1 )(0,1)(0,1) ви можете легко знайти параметри такого бета-розподілу, який "нагадує" форму розподілу.

Зауважте, що логістична регресія надає вам умовні ймовірності , тоді як на своєму сюжеті ви представляєте нам граничний розподілPr(Y=1X) передбачуваних ймовірностей. Це дві різні речі, щоб поговорити.

Немає прямого зв’язку між параметрами логістичної регресії та параметрами бета-розподілу при розгляді розподілу прогнозів з логістичної регресійної моделі. Нижче ви можете побачити дані, змодельовані за допомогою нормальних, експоненціальних та рівномірних розподілів, трансформованих за допомогою логістичної функції. Крім використання абсолютно однакових параметрів логістичної регресії (тобто ), розподіли прогнозованих ймовірностей дуже відрізняються. Тож розподіл прогнозованих ймовірностей залежить не лише від параметрів логістичної регресії, а й від розподілів X -х, і між ними немає простого співвідношення.β0=0,β1=1X

Логістична функція даних, змодельованих у нормальних, експоненціальних та рівномірних розподілах

Оскільки бета - це розподіл значень у , то її не можна використовувати для моделювання двійкових даних, як це робить логістична регресія. Він може бути використаний для моделювання ймовірностей , таким чином ми використовуємо бета-регресію (див. Також тут і тут ). Тож якщо ви зацікавлені, як ведуть себе ймовірності (розуміються як випадкова величина), ви можете використовувати бета-регресію для таких цілей.(0,1)


Отже, якщо Beta може наблизити будь-який такий розподіл, чи не повинно бути співвідношення між його параметрами та ? β
tomka

4
@tomka, але розподіл залежить від розподілу ваших даних і від параметрів, тому навіть такий взаємозв'язок існує, це дуже складний. Очевидно немає прямої залежності між параметрами регресії та параметрами розподілу бета-версії. Спробуйте імітувати прогнози логістичної регресії за одними і тими ж параметрами, використовуючи різні розподіли для , граничний розподіл буде відрізнятися у кожному випадку. X
Тім

4
Бета-розподіл не є таким гнучким - він не може наближати багатомодальні розподіли.
Marcus PS

@MarcusPS Я зробив це більш зрозумілим.
Тім

1
@MarcusPS, за винятком особливого випадку мультимодальних розподілів з режимами на 0 і 1 ...
Бен Болкер

4

Логістична регресія - це особливий випадок узагальненої лінійної моделі (GLM). У цьому конкретному випадку бінарних даних логістична функція - це канонічна функція зв'язку, яка перетворює задану нелінійну регресію в лінійну задачу. ГЛМ є дещо особливими, в тому сенсі, що вони застосовуються лише до розподілів в експоненціальній сім'ї (наприклад, біноміальний розподіл).

За байєсівською оцінкою, бета-розподіл є кон'югатом до біноміального розподілу, що означає, що байєсівське оновлення до бета-попереднього, з біноміальними спостереженнями, призведе до задньої бета-версії. Отже, якщо у вас є рахунки для спостереження бінарних даних, ви можете отримати аналітичну баєсовскую оцінку параметрів біноміального розподілу, використовуючи попередній бета-версія.

Таким чином, по лінії сказаного іншими, я не думаю, що існує пряме відношення, але і розподіл бета, і логістична регресія мають тісний взаємозв'язок з оцінкою параметрів чогось, що слідує за біноміальним розподілом.


1
Я вже поставив +1 для згадування байєсівської точки зору, але зауважую, що у випадку регресійної моделі ми не використовуємо бета-біноміальну модель, а бета-розподіл взагалі не використовується як пріоритетний для параметрів - принаймні у випадку типової байесівської логістики регресія . Тож це безпосередньо не перекладається на бета-біноміальну модель.
Тім

3

P(A=1|X)XXN(0,1)exp(Xβ)μ=1β0=β1=1P(A=1|X)

F(x)=1Φ[ln(1x1)+1],
Q(x)=11+exp(Φ1(1x)1),
f(x)=1x(1x)2πexp((ln(1/x1)+1)22),

Ви можете перевірити результати, наведені вище в R :

n = 100000

X = cbind(rep(1, n), rnorm(n)) # simulate design matrix
Y = 1 / (exp(-X %*% c(1,1)) + 1) # P(A=1|X)

Z1 = 1 / (rlnorm(n, -1, 1) + 1) # simulate from lognormal directly
Z2 = 1 / (1 + exp(qnorm(runif(n)) - 1)) # simulate with inverse CDF

# Kolmogorov–Smirnov test
ks.test(Y, Z1)
ks.test(Y, Z2)

# plot fitted density
new.pdf = function(x) {
  1 / (x * (1 - x) * sqrt(2 * pi)) * exp(-0.5 * (log(1 / x - 1) + 1)^2)
}
hist(Y, breaks = "FD", probability = T)
curve(new.pdf, col = 4, add = T)

enter image description here


xf(x)[inf,inf]P(A|X)[0,1]f(x)P(A|X)

1/x1>0x(0,1)f

X

@whuber: схоже, я щось помилився, цю частину я видалив.
Франциск
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.