Допоможіть мені зрозуміти


13

Я намагаюся запустити байєсівський логіт на даних тут . Я використовую bayesglm()в armпакеті в Р. Кодування досить просто:

df = read.csv("http://dl.dropbox.com/u/1791181/bayesglm.csv", header=T)
library(arm)
model = bayesglm(PASS ~ SEX + HIGH, family=binomial(link="logit"), data=df)

summary(model) дає такий вихід:

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  0.10381    0.10240   1.014    0.311    
SEXMale      0.02408    0.09363   0.257    0.797    
HIGH        -0.27503    0.03562  -7.721 1.15e-14 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 2658.2  on 1999  degrees of freedom
Residual deviance: 2594.3  on 2000  degrees of freedom
AIC: 2600.3

glm()bayesglm()pz


Це коментар, а не відповідь, але саме це мало б для мене сенс. Ви отримуєте оцінки, які, ймовірно, значення, для яких задній розподіл максимізовано. Можливо також, що вони є лише засобами заднього? Варто перевірити, чи зможете ви. Але незалежно від того, які саме деталі є, як тільки у вас є деякі оцінки, ви можете перевірити їх за допомогою звичайного кошторису / Std. Помилка -> z-score процедура, яка працює, якщо задній досить близький до нормального (він переходить до норми за деяких умов, які зазвичай дотримуються).
Ерік

Ерік ... Ти прав: коефіцієнти справді є засобами задньої густини. Моє запитання щодо p- і z-значень. Що вони тут представляють?
user3671

Добре. Якщо у вас щільність приблизно нормально розподілена, ви можете перевірити, чи є середнє значення нульовим, взявши z-бал = середнє / стандартне відхилення розподілу та порівнявши його зі звичайним нормальним розподілом. Тоді ви дивитесь, наскільки малоймовірно, що ваше значення чи більша величина опиняться під нормальним нормальним розподілом -> p-значенням. Докладніше див. Z-score у Вікіпедії.
Ерік

Ну так. Але навіщо турбуватися робити це в байєсівській обстановці? За байєсівським висновком, оцінка балів - це моя найкраща здогадка про випадковий параметр, тому не потрібно тестувати його. Щонайбільше, я можу включити "достовірний інтервал", який еквівалентний частолістському "інтервалу довіри", але статистична інтерпретація якої значно відрізняється. Це заплутана частина щодо результату підсумків (). Дух - байєсівський, але вихід частолістський?
user3671

Один момент полягає в тому, що отримана вами оцінка буде різною, оскільки ви використовували попередню. І хоча бальна оцінка - це "найкраща здогадка", якщо ви хочете показати байєсівським способом, що щось має ефект, ви спробуєте показати, що достовірний інтервал не містить нуля. Коли ви наближаєте заднє до нормального з тим же середнім і sd (асимптотично правильним), то інтервал достовірності (1-p / 2) є найбільшим симетричним інтервалом достовірності, що містить нуль, тому ваша відповідь в основному однакова. Р-значення, вказане вище.
Ерік

Відповіді:


16

Чудове запитання! Хоча є байєсівські p-значення , і один з авторів пакету озброєнь є захисником, те, що ви бачите у своєму результаті, не є байєсівським p-значенням. Перевірте класmodel

class(model)
"bayesglm" "glm"      "lm" 

і ви бачите, що клас bayesglm успадковує від glm. Крім того, експертиза пакету зброї не показує конкретного підсумкового методу для об'єкта bayesglm. Отже, коли ви робите

summary(model)

ти насправді робиш

summary.glm(model)

та отримання частої інтерпретації результатів. Якщо ви хочете більше байєсівської точки зору, це функціяdisplay()


+1 Відмінна відповідь! Це біда з R, є так багато високорозумних статистиків, які пишуть жахливий код, який залишає ці види мін лежачи.
Богдановіст

Це здається навмисним вибором з боку дизайнерів, а не недоглядом.
atiretoo - відновити моніку

Прочитавши посилання, я погоджуюся з наміром, але в цьому випадку резюме () слід було б повторно реалізувати, щоб просто викликати display (), а не давати дурницькі результати без попередження. Людина, яка задала це запитання, отримала код, який порушив модель користувача для R, яка була встановлена ​​всіма іншими об'єктами, які вони коли-небудь використовували. Це жахлива практика програмування.
Богдановіст

2
Велике спасибі, atiretoo. Це викликає ще одне питання. Яка різниця між відображенням () та підсумком ()? Мені здається, що вихід з першого - це лише вихід з другого, менше двох стовпців і округлений до двох цифр. Виявилося б так, з поста Гельмана, який ви зв'язали вище.
user3671

Так, і з дискусії в блозі Ендрю Гелмана звучить так, ніби вони це виправлять у майбутніх версіях пакету зброї.
atiretoo - відновити моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.