Граничний ефект моделі Пробіта та Логіта

12

Чи може хто-небудь пояснити, як обчислити граничний ефект моделі Пробіта та Логіта в умовах непростої людини?

Я новачок у статистиці, і я збентежений щодо цих двох моделей.

Зауважте, що цифри, що виходять із моделей Probit та Logit, виглядають так, ніби вони вимірюють приблизно одне і те ж, але часто чисельно відрізняються. Коли ви переводите їх назад у реальне життя, різниця між ними зазвичай стає значно меншою.

— Генрі

15

Я думаю, що кращий спосіб побачити граничний ефект даної змінної, скажімо , - це створити графік розкиду передбачуваної ймовірності на вертикальній осі та мати на горизонтальній осі. Це самий «непростий» спосіб, який я можу подумати про те, наскільки впливовою є дана змінна. Ні математики, а лише фотографії. Якщо у вас багато точок передачі даних, тоді полегшення або плавніше розсіювання може допомогти побачити, де знаходиться більшість даних (на противагу лише хмарі точок). $X_j$ $X_j$

Не впевнений, наскільки "Layman" наступний розділ, але ви можете вважати його корисним.

Якщо ми подивимось на граничний ефект, назвемо його , зазначивши, що , отримаємо $m_j$ $g(p)=\sum_kX_k\beta_k$

m_{j} = \frac{\partial p}{\partial X_{j}} = \frac{β_{j}}{g^{'} [g^{- 1} (X^{T} β)]} = \frac{β_{j}}{g^{'} (p)}

$m_j=\frac{\partial p}{\partial X_j}=\frac{\beta_j}{g'\left[g^{-1}(X^T\beta)\right]}=\frac{\beta_j}{g'(p)}$

Отже граничний ефект залежить від передбачуваної ймовірності та градієнта функції зв’язку на додаток до бета-версії. Ділення на походить від ланцюгового правила диференціації та того факту, що . Це можна показати, диференціюючи обидві сторони очевидно справжнього рівняння . Маємо також, що за визначенням. Для моделі logit маємо , а граничним ефектом є: $g'(p)$ $\frac{\partial g^{-1}(z)}{\partial z}=\frac{1}{g'\left[g^{-1}(z)\right]}$ $z=g\left[g^{-1}(z)\right]$ $g^{-1}(X^T\beta)=p$ $g(p)=\log(p)-\log(1-p)\implies g'(p)=\frac{1}{p}+\frac{1}{1-p}=\frac{1}{p(1-p)}$

m_{j}^{l o g i t} = β_{j} p (1 - p)

$m_j^{logit}=\beta_jp(1-p)$

Що це значить? свердловина дорівнює нулю при і при , і вона досягає свого максимального значення при . Отже граничний ефект найбільший, коли ймовірність становить близько , а найменший, коли - близько або близько . Однак все ще залежить від , тому граничні ефекти є складними. Насправді, оскільки це залежить від , ви отримаєте різний граничний ефект для різних $p(1-p)$ $p=0$ $p=1$ $0.25$ $p=0.5$ $0.5$ $p$ $0$ $1$ $p(1-p)$ $X_j$ $p$ $X_k,\;k\neq j$ значення. Можливо, одна вагома причина просто зробити цей простий сюжетний сюжет - не потрібно вибирати, які значення коваріатів використовувати.

Для пробітової моделі маємо де стандартний звичайний CDF, а стандартний звичайний pdf. Таким чином ми отримуємо: $g(p)=\Phi^{-1}(p)\implies g'(p)=\frac{1}{\phi\left[\Phi^{-1}(p)\right]}$ $\Phi(.)$ $\phi(.)$

m_{j}^{p r o b i t} = β_{j} ϕ [Φ^{- 1} (p)]

$m_j^{probit}=\beta_j\phi\left[\Phi^{-1}(p)\right]$

Зауважте, що це має більшість властивостей, про які граничний ефект я обговорював раніше, і однаково справедливо для будь-якої функції зв'язку, симетричної приблизно (і, звичайно, наприклад, ). Залежність від є більш складною, але все ж має загальну "горбисту" форму (найвища точка у , найнижча - і ). Функція посилання змінить розмір максимальної висоти (наприклад, максимум пробіту - , логіт - ), і як швидко граничний ефект буде спрямований до нуля. $m_j^{logit}$ $0.5$ $g(p)=tan(\frac{\pi}{2}[2p-1])$ $p$ $0.5$ $0$ $1$ $\frac{1}{\sqrt{2\pi}}\approx 0.4$ $0.25$

— ймовірністьіслогічна
джерело

effectsПакет в R може легко виробляти такі ділянки передбаченої ймовірності по вертикальній осі проти X на горизонтальній осі. Дивіться socserv.socsci.mcmaster.ca/jfox/Misc/effects/index.html

— landroni

Дивіться також: stats.stackexchange.com/questions/18814/…

— landroni

5

Моделі logit і probit зазвичай використовуються для з'ясування ймовірності того, що залежна змінна y дорівнює 0 або 1 на основі ряду вхідних змінних.

Англійською: Припустимо, ви намагаєтесь передбачити бінарне значення, наприклад, чи розвинеться у когось захворювання серця протягом життя чи ні. У вас є ряд змінних даних, таких як кров'яний тиск, вік, чи є вони курцем, їх ІМТ, де вони живуть тощо. Усі ці змінні можуть певним чином сприяти шансам у когось із захворювань серця.

Граничний ефект однієї вхідної змінної полягає в тому, що якщо ви збільшуєте цю змінну на трохи, як це впливає на ймовірність захворювання серця? Припустимо, артеріальний тиск збільшується незначно, як це може змінити шанси на захворювання серця? Або якщо підвищити вік на рік?

Деякі з цих ефектів можуть бути також нелінійними: збільшення ІМТ незначною мірою може мати зовсім інший ефект для тих, хто має дуже здоровий ІМТ, ніж для тих, хто цього не робить.

— грабіж
джерело

1

Ви все ще хочете, щоб ваш мирянин знав обчислення, оскільки граничний ефект є похідною від встановленої ймовірності щодо змінної, що цікавить. Оскільки підходяща ймовірність є функцією зв'язку (logit, probit або будь-якої іншої), застосованої до встановлених значень, для обчислення її вам потрібне правило ланцюга. Так, у лінійних моделях індексів (де параметри вводяться як щось на зразок X'b) вона дорівнює оцінці параметра в рази похідній функції зв'язку. Оскільки похідна відрізняється при різних значеннях регресорів (на відміну від лінійної моделі), ви повинні вирішити, де оцінити граничний ефект. Природним вибором були б середні значення всіх регресорів. Іншим підходом було б оцінити ефект від кожного спостереження, а потім оцінити їх середнє значення. Тлумачення відповідно відрізняється.

— Олексій
джерело