У мене є дані за два роки, які в основному виглядають так:
Дата _ __ Насильство Y / N? _ Кількість пацієнтів
01.01.2008 _ ___ 0 __ _ __ _ ____ 11
1/1/2008 _ __ _ 0 _ __ _ __ _ __ 11
3/1/2008 _ ____ 1 __ _ __ _ ____ 12
4/1/2008 _ ____ 0 __ _ __ _ ____ 12
...
31/12 / 2009_ _ __ 0_ _ __ _ __ _ __ 14
тобто два роки спостережень психіатричного відділення, що свідчать про те, чи був інцидент насильства в цей день (1 так, 0 ні), а також кількість пацієнтів у відділенні. Гіпотеза, яку ми хочемо перевірити, полягає в тому, що більша кількість пацієнтів, які перебувають на палаті, пов'язані зі збільшеною ймовірністю насильства в палаті.
Звичайно, ми розуміємо, що нам доведеться пристосуватися до того, що коли на палаті більше пацієнтів, насильство є більш імовірним, оскільки їх є лише більше - нас цікавить, чи збільшується ймовірність насильства кожного, коли на палаті більше пацієнтів.
Я бачив декілька робіт, які просто використовують логістичну регресію, але я думаю, що це неправильно, оскільки існує авторегресивна структура (хоча, дивлячись на функцію автокореляції, вона не виходить вище .1 в будь-якому відставанні, хоча це вище «Значна» синя штрихова лінія, яку R намалює для мене).
Просто для того, щоб все було складніше, я можу, якщо хочу розбити результати на окремих пацієнтів, тому дані виглядатимуть так само, як це було вище, за винятком того, що я мав би дані для кожного пацієнта, 1/1/2008, 2 / 1/2008 тощо та ідентифікаційний код, що знижується, щоб дані показали всю історію інцидентів для кожного пацієнта окремо (хоча не всі пацієнти присутні на всі дні, не впевнені, що це має значення).
Я хотів би використовувати lme4 в R для моделювання авторегресивної структури у кожного пацієнта, але деякі Googling придумують цитату «lme4 не створений для боротьби з авторегресивними структурами». Навіть якби це було, я не впевнений, що все-таки розумію, як написати код.
На всякий випадок, коли хтось помітить, я поставив таке запитання, як це було раніше, це різні набори даних з різними проблемами, хоча насправді вирішити цю проблему допоможе в цьому (хтось запропонував я використовувати змішані методи раніше, але ця проблема авторегресії зробила мене не знаю, як це зробити).
Тож я трохи застряг і втратив чесно. Будь-яка допомога вдячно отримана!
pgmm
з Plm пакета , але , як змінна відгуку двоичная я не знаю точно , як це зробити. Можливо, інші можуть розробити ... (І так, ви праві: я розумію, що коли у вас є ендогенна змінна, у цьому випадку відставання значення, ви не можете використовувати REML для оцінки, оскільки воно упереджене, тому вам потрібно використовувати GMM .)