В даний час я працюю над серією моделей часових рядів Пуассона, намагаючись оцінити ефект зміни того, як були отримані підрахунки (перехід від одного діагностичного тесту до іншого), контролюючи інші тенденції з часом (скажімо, загальне збільшення рівня захворюваність). У мене є дані для кількох різних сайтів.
Хоча я також займався GAM, я підходив до ряду досить базових GLM з тенденціями часу, а потім об'єднував результати. Код для цього виглядатиме приблизно так у SAS:
PROC GENMOD data=work.data descending;
model counts = dependent_variable time time*time / link=log dist = poisson;
run;
або це в R:
glm(counts ~ dependent_variable + time + time*time, family="poisson")
Потім беруть ці оцінки та об'єднуючи їх по різних сайтах. Також пропонується спробувати використовувати змішану модель Пуассона з випадковим нахилом і перехопленням для кожного сайту, а не об'єднання. Таким чином, ви по суті матимете фіксований ефект залежної_ змінної, а потім випадковий ефект на перехоплення та час (або в ідеалі час і час ^ 2, хоча я розумію, що він стає трохи волохатим).
Моє питання полягає в тому, що я поняття не маю, як підходити до однієї з цих моделей, і здається, що змішані моделі - це те, де документація кожного стає раптом дуже непрозорою. У когось є просте пояснення (або код) про те, як підходити до того, що я шукаю, і на що слід звертати увагу?