Нехай незалежні і
Припустимо також, що параметри і p = ( p 1 , … , p n ) задовольняють
Якщо однакові коваріати впливають на і p так, що B = G , то чому нульова завищена пуассонова регресія потребує вдвічі більше параметрів, ніж пуассонова регресія?
Нехай незалежні і
Припустимо також, що параметри і p = ( p 1 , … , p n ) задовольняють
Якщо однакові коваріати впливають на і p так, що B = G , то чому нульова завищена пуассонова регресія потребує вдвічі більше параметрів, ніж пуассонова регресія?
Відповіді:
У випадку з нульовим роздутом Пуассона, якщо , то β і λ обидві мають однакову довжину, яка є кількістю стовпців B або G . Таким чином, кількість параметрів вдвічі перевищує кількість стовпців проектної матриці, тобто вдвічі більше пояснювальних змінних, включаючи перехоплення (і все необхідне фіктивне кодування).
У прямій пуассоновій регресії немає жодного вектора, про який слід турбуватися, не потрібно оцінювати λ . Тож кількість параметрів - це лише довжина β тобто половина кількості параметрів у випадку, завищеному нулем.
Тепер немає жодної конкретної причини, чому дорівнює G , але в цілому це має сенс. Однак можна уявити процес генерування даних, коли шанс виникнення будь-яких подій створюється одним процесом G λ і зовсім іншим процесом B β визначає, скільки подій існує, враховуючи ненульові події. Як надуманий приклад, я вибираю аудиторії на основі результатів іспитів з історії, щоб грати в якусь непов’язану гру, а потім спостерігаю кількість забитих м'ячів. У цьому випадку B може бути зовсім іншим порівняно з G (якщо бали екзамену з історії водіння історії відрізняються від показників водіння в грі) та β і λможе мати різну довжину. може бути більше стовпців, ніж B або менше. Тож нульова завищена модель Пуассона в такому випадку матиме більше параметрів, ніж проста модель Пуассона.
У звичайній практиці я думаю, що більшість часу.