Бета-регресія (тобто GLM з бета-розподілом і, як правило, функцією посилання logit) часто рекомендується мати справу з змінною, яка залежить від відповіді, приймаючи значення між 0 і 1, такі як дроби, коефіцієнти або ймовірності: Регресія для результату (відношення або частка) між 0 і 1 .
Однак завжди стверджується, що бета-регресію не можна використовувати, як тільки змінна відповіді дорівнює 0 або 1 хоча б один раз. Якщо це так, потрібно використовувати або бета-модель з надутою бетоном, або здійснити певну трансформацію відповіді тощо. Бета-регресія даних про пропорції, включаючи 1 і 0 .
Моє запитання: яке властивість розподілу бета-версії запобігає бета-регресії мати справу з точними 0 і 1 та чому?
Я здогадуюсь, що і не підтримують бета-розподіл. Але для всіх параметрів форми і , як нуль і один перебувають в підтримці бета - розподілу, це тільки для невеликих параметрів форми , що розподіл звертається в нескінченність в одній або обох сторін. І, можливо, вибіркові дані такі, що та забезпечують найкращу відповідність, виявилися б вище 1 .α > 1 β > 1
Чи означає це , що в деяких випадках один може фактично використовувати бета регресу навіть з нулями / з них?
Звичайно, навіть якщо 0 і 1 підтримують бета-розподіл, ймовірність спостерігати рівно 0 або 1 дорівнює нулю. Але така ймовірність спостерігати будь-який інший заданий набір значень, тому це не може бути проблемою, чи не так? (См. Цей коментар від @Glen_b).
У контексті бета-регресії розподіл бета параметризується по-різному, але при він все одно повинен бути чітко визначений на [ 0 , 1 ] для всіх μ .