Як інтерпретувати термін перехоплення в GLM?


20

Я використовую R, і я аналізував свої дані за допомогою GLM за допомогою біноміального зв'язку.

Я хочу знати, яке значення перехоплює у вихідній таблиці. Перехоплення для однієї з моїх моделей суттєво відрізняється, проте змінна - ні. Що це означає?

Що таке перехоплення. Я не знаю, чи я просто плутаю себе, але шукаю в Інтернеті, нічого не говорячи, це саме це, зверніть на це увагу ... чи ні.

Будь ласка, допоможіть, дуже розчарований студент


glm(formula = attacked_excluding_app ~ treatment, family = binomial, 
    data = data)
Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-2.3548   0.3593   0.3593   0.3593   0.3593  
Coefficients:
                         Estimate Std. Error z value Pr(>|z|)   
(Intercept)                 2.708      1.033   2.622  0.00874 **
treatmentshiny_non-shiny    0.000      1.461   0.000  1.00000

(Dispersion parameter for binomial family taken to be 1)
Null deviance: 14.963  on 31  degrees of freedom
Residual deviance: 14.963  on 30  degrees of freedom
(15 observations deleted due to missingness)
AIC: 18.963
Number of Fisher Scoring iterations: 5

1
Яка функція зв'язку, яку ви вказуєте в glm?
Томаш

5
Перехоплення - це передбачуване значення залежної змінної, коли всі незалежні змінні дорівнюють 0. Без додаткової інформації про вашу модель я не можу сказати, чи має це значення у вашому випадку.
Пітер Флом - Відновити Моніку

Відповіді:


21

Термін перехоплення - це перехоплення у лінійній частині рівняння GLM, тому середня модель для вас - , де g - ваша функція зв'язку, а X β - ваша лінійна модель. Ця лінійна модель містить "термін перехоплення", тобто:Е[Y]=г-1(Хβ)гХβ

Хβ=c+Х1β1+Х2β2+

У вашому випадку перехоплення суттєво не дорівнює нулю, але змінна - ні, тому це сказано

Хβ=c0

Тому що ваша функція зв'язку двочлена

г(мк)=ln(мк1-мк)

І так, тільки з перехоплюючим терміном, ваша відповідна модель середнього значення:

Е[Y]=11+е-c

Ви можете бачити, що якщо то це відповідає просто шансу 50:50 отримати Y = 1 або 0, тобто E [ Y ] = 1c=0Е[Y]=11+1=0,5

Отже, ваш результат говорить про те, що ви не можете передбачити результат, але один клас (1 або 0) є більш імовірним, ніж інший.


2
Ти мене налякав на E [Y] = .... :). Дякую за відповідь, я (добрий) розумію, що ви говорите. Ви сказали, що перехоплення - сиг. не нульовий, але вар. ні, це p = 1,00! Який вплив має значення змінних p на значення, що я можу сказати про відновлення?
Самуель Уолдрон

2
Якщо значення p змінних p не є малим, воно зазвичай не включає цю змінну в моделі. У вашому випадку змінна навіть не оцінюється як ненульове значення, отже, р-значення 1,00. В основному не існує взаємозв'язку між "лікуванням" та "атакуваним_виключенням_апп". Відсутність стосунків тут настільки досконала, що вона майже доглядна, хоча у вас є невеликий набір даних. Можливо, варто візуалізувати ваші дані та перевірити, чи є це розумним.
Корон

2
+1 для відповіді (і на думку в коментарі про те, що в наборі даних відбувається щось дивне), хоча я не погоджуюся з відкриттям вашого коментаря "Якщо значення змінних p не мала, зазвичай ця змінна не повинна включати в модель ". Це не обов'язково так - часто хочеться повідомити про масштаби відносин, навіть якщо воно не є «значущим» (і ще більше, якщо вам було цікаво моделювати відносини для початку, тоді нульовим результатом є все ще важливо повідомити.)
Джеймс Стенлі

1
@James - дуже хороший момент, завжди слід повідомляти про те, які тестовані вами змінні - я мав би бути зрозумілішим, я просто мав на увазі, що зазвичай не включати цю змінну при спробі використовувати модель для прогнозування (оскільки це зазвичай означатиме перевищення рівня) ).
Корон

@Corone - Мені цікаві ваші коментарі тут щодо змінної в / виключення та їх відношення до потоку на stats.stackexchange.com/questions/17624/…
rolando2

5

Мені здається, може виникнути якась проблема з даними. Не дивно, що оцінка параметра для коефіцієнта складе 0,000. Схоже, що і ваш DV, і ваш IV є дихотомічними, і пропорції вашого DV не змінюються взагалі від IV. Чи це правильно?

Перехоплення, як я зазначив у своєму коментарі (і як випливає з відповіді @corone) - це значення DV, коли IV - 0. Як було зашифровано IV? Однак, той факт, що оцінка коефіцієнта дорівнює 0,000, означає, що IV не має ніякої різниці.

журнал(p1-p)


Привіт, хлопці, ще раз дякую за коментарі. Точки даних майже однакові. Я повідомляю про це у звіті і все-таки мушу виділити його. Ось чому результати виглядають дивним. З цими даними (GLM) та іншими наборами даних у моїх звітах (GLMM) я заздалегідь працюю (# TEAM2x2x2x2), перш ніж я можу піти. Я думаю, що моя головна проблема полягає в тому, що я знаю, про що мені потрібно повідомити, чи я маю на увазі статистику перехоплення або для IV? Нижче мій (сподіваюся, більш стандартний) GLMM знову з двочленним зв’язком.
Самуель Уолдрон

Узагальнена лінійна змішана модель, що відповідає формулі наближення Лапласа: атакований ~ Лікування + Пробний + Лікування * Пробний + (1 | Птах) Дані: дані AIC BIC logLik відхилення 139.6 153.8 -64.78 129.6 Випадкові ефекти: Групи Назва Варіантність Std.Dev. Птах (Перехоплення) 0,87795 0,93699 Кількість предметів: 128, групи: Птах, 32
Самуель Уолдрон

Фіксовані ефекти: Оцінити Std. Помилка z значення Pr (> | z |) (Перехоплення) 3.19504 0,90446 3,533 .000412 *** Лікування обшивки_не-блискучі 0,02617 1,22664 0,021 .983558 Пробний -1,53880 0,36705 -4,192 2,76е-05 *** Лікування: Пробне 0,16909 0,49501 0,342 .732655 --- Знак. коди: 0 ' ' 0,001 ' ' 0,01 '0,05'. ' 0,1 '' 1 Кореляція фіксованих ефектів: (Intr) Trtm_- Trial Trtmntshn_- -0.712 Судова версія -0.895 0.638 Trtmnts _-: T 0.664 -0.896 -0.742
Samuel Waldron

3

У вашому випадку перехоплення - це велике значення attacked_excluding_app, обчислене для всіх даних незалежно від treatment. Тест на значимість у таблиці коефіцієнтів - це тестування, чи він суттєво відрізняється від нуля. Наскільки це актуально, залежить від того, чи є у вас апріорні причини очікувати, що це буде нуль чи ні.

Наприклад, уявіть, що ви протестували препарат та плацебо на їх вплив на артеріальний тиск. Для кожного суб'єкта ви записуєте зміну їх артеріального тиску шляхом обчислення (тиск після лікування - тиск до лікування) і трактуєте це як залежну змінну у своєму аналізі. Потім ви виявите, що ефект від лікування (препарат проти плацебо) є незначним, але перехоплення суттєво> 0 - це означає, що в середньому артеріальний тиск у ваших суб'єктів зростало за два рази вимірювання. Це може бути цікавим і потребує подальшого дослідження.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.