Як моделювати невід’ємні нульові завищені безперервні дані?


16

На даний момент я намагаюся застосувати лінійну модель ( family = gaussian) до показника біорізноманіття, який не може приймати значення нижче нуля, є завищеним нулем і є безперервним. Значення варіюються від 0 до трохи більше 0,25. Як наслідок, в залишках моделі є досить очевидна закономірність, якої я не встиг позбутися: введіть тут опис зображення

Хтось має ідеї, як це вирішити?


1
Ласкаво просимо в CV! Зауважте, що ваше ім'я користувача, ідентифікатор та посилання на вашу сторінку користувача автоматично додаються до кожної публікації, яку ви створюєте, тому немає необхідності підписувати свої повідомлення. Насправді, ми вважаємо за краще, щоб ви цього не зробили.
Срібна рибка

3
Якщо вона завищена нулем, вона не може бути безперервною, оскільки безперервні змінні не можуть мати жодних стрибків у cdf (і явно є один на 0). Це може бути безперервним, окрім 0-х.
Glen_b -Встановіть Моніку

Відповіді:


32

У випадку нуля завищених (напів-) безперервних розподілів існує безліч рішень:

  • Регресія тобіту : передбачає, що дані надходять з одного базового нормального розподілу, але негативні значення цензуруються і складаються на нуль (наприклад, пакет censReg )
  • перешкода або "двоступенева" модель: використовуйте біноміальну модель, щоб передбачити, чи є значення 0 або> 0, а потім використовуйте лінійну модель (або Гамма, або усічений Нормальний, або log-Нормальний) для моделювання спостережуваних ненульових значень
  • 1<p<2x>0

Або, якщо ваша структура даних досить проста, ви можете просто використовувати лінійні моделі та використовувати перестановочні тести чи якийсь інший надійний підхід, щоб переконатися, що ваш висновок не зіпсується цікавим розподілом даних.

Для більшості цих випадків доступні пакети / рішення R.

В SE є інші запитання щодо нуля завищених (напів) безперервних даних (наприклад, тут , тут і тут ), але вони, схоже, не дають чіткої загальної відповіді ...

Дивіться також Min & Agresti, 2002 р., Моделювання негативних даних при скупченні нуля: опитування для огляду.


@Ben Bolker Чи використовували б ви лінійну модель (або гамма, усічений звичайний, або нормально-звичайний) для моделювання "передбачуваних чи фактичних ненульових значень?
rolando2
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.