Передумови: Я зараз є біостатистом, який веде боротьбу з набором частот клітинної експресії. Дослідження піддало певні пептиди безліч клітин, зібраних у групи від різних донорів. Клітини або виражають певні біомарки у відповідь, або їх немає. Потім ставки відповідей реєструються для кожної групи донорів. Частота відповідей (виражена у відсотках) є результатом інтересу, а вплив пептидів є прогнозом.
Зауважте, що спостереження групуються у донорів.
Оскільки у мене є лише підсумкові дані, я ставлюсь до донорських показників відповіді як постійні дані (принаймні поки що).
Ускладнення виникає через те, що я маю багато нулів у своїх даних. Занадто багато, щоб їх ігнорувати. Я розглядаю нульову завищену гамма-модель, щоб вирішити той факт, що я перекосив безперервні дані в поєднанні з надмірною кількістю нулів. Я також розглядав модель Тобіта, але це здається неповноцінним, оскільки передбачає цензуру на нижній межі, на відміну від справжніх нулів (економетрики можуть сказати, що відмінність є суперечливою).
Питання: Взагалі кажучи, коли доцільно використовувати гамма-модель із завищеною нулем? Тобто, які припущення? І як можна інтерпретувати свої умовиводи? Буду вдячний за посилання на документи, які обговорюють це, якщо у вас є такі.
Я знайшов посилання на SAS-L, в якому Дейл МакЛерран надає код NLMIXED для гамма-моделі з завищеною нулем, тому, здається, це можливо. Тим не менш, я б не хотів знімати сліпо.