Я підхоплюю модель випадкових ефектів glmer
до деяких бізнес-даних. Метою є аналіз результатів продажів через дистриб'ютора з урахуванням регіональних відмінностей. У мене є такі змінні:
distcode
: ідентифікатор дистриб'ютора, близько 800 рівнівregion
: географічний ідентифікатор верхнього рівня (північ, південь, схід, захід)zone
: географія середнього рівня, що вкладаєтьсяregion
, приблизно 30 рівнівterritory
: географія низького рівня, закладена в межахzone
, близько 150 рівнів
Кожен дистриб'ютор працює лише на одній території. Складна частина полягає в тому, що це узагальнені дані з однією точкою даних на дистрибутора. Таким чином, у мене є 800 точок даних, і я намагаюся підходити (принаймні) до 800 параметрів, хоча і в регульованому порядку.
Я встановив модель наступним чином:
glmer(ninv ~ 1 + (1|region/zone/territory) + (1|distcode), family=poisson)
Це працює без проблем, хоча друкує примітку:
Кількість рівнів групуючого коефіцієнта для випадкових ефектів дорівнює n, кількості спостережень
Це розумна справа? Я отримую кінцеві оцінки всіх коефіцієнтів, і АПК також не є необґрунтованим. Якщо я спробую пуассоновий GLMM із посвідченням ідентичності, AIC набагато гірше, тому посилання журналу є принаймні хорошою відправною точкою.
Якщо я побудую відповідні значення та відповідь, я отримаю те, що по суті є ідеальним пристосуванням, яке, мабуть, полягає в тому, що я маю одну точку даних на кожного розповсюджувача. Це розумно, чи я роблю щось абсолютно нерозумно?
Це використання даних за один місяць. Я можу отримувати дані протягом декількох місяців і отримувати певну тиражу таким чином, але мені доведеться додати нові терміни для зміни місяця в місяць та можливих взаємодій, правильно?
ETA: Я знову запустив вищевказану модель, але без family
аргументів (тож просто гауссова LMM, а не GLMM). Тепер lmer
дав мені таку помилку:
Помилка в (функція (fr, FL, старт, REML, багатослівна): Кількість рівнів групуючого коефіцієнта для випадкових ефектів має бути меншою за кількість спостережень
Тож я б здогадався, що я не роблю щось розумне, оскільки зміна сім'ї не повинно мати наслідків. Але питання зараз, чому це працювало в першу чергу?