Нещодавно мене зацікавило впровадження бета-регресійної моделі, для результатів якої пропорція. Зауважимо, що цей результат не впишеться у двочленний контекст, оскільки в цьому контексті немає змістовної концепції дискретного "успіху". Насправді результат насправді є часткою тривалості; чисельник - це кількість секунд, коли певна умова активна за загальну кількість секунд, протягом яких умова мала право бути активною. Я прошу вибачення за капризи, але я не хочу занадто зосереджуватися на цьому точному контексті, тому що я розумію, що існує безліч способів такого процесу моделювати, окрім бета-регресії, і наразі мене більше цікавить теоретично питання, що виникли в моїх спробах впровадити таку модель (хоча я, звичайно,
У будь-якому випадку, усі ресурси, які я зміг знайти, вказували на те, що бета-регресія зазвичай підходить за допомогою посилання logit (або probit / cloglog), а параметри інтерпретуються як зміни в логіці. Однак я ще не знайшов посилання, яке насправді дає будь-яке реальне обґрунтування того, чому можна було б скористатися цим посиланням.
Оригінальний папір Ferrari & Cribari-Neto (2004) не дає виправдання; вони зазначають лише, що функція logit є "особливо корисною" через інтерпретацію коефіцієнта шансів експонентованих параметрів. Інші джерела натякають на бажання відобразити від інтервалу (0,1) до реальної лінії. Однак чи потрібна нам функція зв'язку для такого відображення, враховуючи, що ми вже припускаємо бета-розподіл? Які переваги надає функція зв'язку вище та за межами обмежень, накладених на початку бета-розподілу?Я провів пару швидких симуляцій і не бачив прогнозів за межами інтервалу (0,1) зі зв’язком ідентичності, навіть при моделюванні з бета-розподілів, маса ймовірностей яких значною мірою близька до 0 або 1, але, можливо, моє моделювання не були достатньо загальними, щоб наздогнати деякі патології.
Мені здається, виходячи з того, як люди на практиці інтерпретують оцінки параметрів з бета-регресійних моделей (тобто як коефіцієнти шансів), які вони неявно роблять висновок щодо шансів на "успіх"; тобто вони використовують бета-регресію як заміну біноміальної моделі. Можливо, це доречно в деяких контекстах, враховуючи взаємозв'язок бета-біноміального розподілу, але мені здається, що це має бути більше особливим випадком, ніж загальним. У цьому питанні надається відповідь на інтерпретацію коефіцієнта шансів відносно безперервної пропорції, а не на результат, але мені здається, що надмірно громіздко намагатися тлумачити речі таким чином, на відміну від використання, скажімо, журналу або ідентифікаційне посилання та інтерпретація% змін або змін-одиниць.
Отже, чому ми використовуємо посилання logit для бета-регресійних моделей? Чи просто для зручності пов'язати це з біноміальними моделями?