На даний момент я аналізую дані з серії поведінкових експериментів, які використовують наступний захід. Учасників цього експерименту просять вибрати підказки, які (вигадані) інші люди могли використати для вирішення серії з 10 анаграм. Учасників вважають, що ці інші люди або наберуть, або втратять гроші, залежно від їхньої ефективності у вирішенні анаграм. Підказки різняться тим, наскільки вони корисні. Наприклад, для анаграми NUNGRIN, анаграми ЗАБУДУВАННЯ, можуть бути три підказки:
- Швидкий рух (бездоганний)
- Що ви робите в марафонській гонці (корисно)
- Не завжди здорове хобі (безкорисне)
Для формування міри я підраховую кількість разів (з 10), коли учасник вибирає негідну підказку для іншої людини. В експериментах я використовую різноманітні різні маніпуляції, щоб вплинути на корисність підказки, яку обирають люди.
Оскільки міра корисності / безпорадності є досить сильно позитивно скасованою (велика частка людей завжди вибирає 10 найкорисніших підказок), а оскільки міра є змінною кількістю, я використовував узагальнену лінійну модель Пуассона для аналізу цих даних. Однак, коли я ще раз читав про пуассонову регресію, я виявив, що оскільки Пуассонова регресія не незалежно оцінює середнє значення та дисперсію розподілу, вона часто недооцінює дисперсію в наборі даних. Я почав досліджувати альтернативи пуассонової регресії, такі як квазіпоассонова регресія або негативна біноміальна регресія. Однак я визнаю, що я досить новачок у подібних моделях, тому приходжу сюди за порадою.
Хтось має рекомендації щодо того, яку модель використовувати для такого роду даних? Чи є якісь міркування, про які я маю знати, (наприклад, чи є одна конкретна модель потужнішою за іншу?)? Яку діагностику слід переглянути, щоб визначити, чи обрана вами модель належним чином обробляє мої дані?