У мене є деякі дані в [0,1], які я хотів би проаналізувати за допомогою бета-регресії. Звичайно, щось потрібно зробити, щоб вмістити 0,1 значення. Мені не подобається змінювати дані, щоб відповідати моделі. також я не вірю, що інфляція нуля і 1 - це гарна ідея, тому що я вважаю, що в цьому випадку слід вважати 0-ма дуже позитивними значеннями (але я не хочу точно говорити, яке значення підходить. Розумний вибір Я вважаю, було б вибрати невеликі значення, такі як .001 та .999, і підігнати модель, використовуючи сукупний dist для бета-версії. Отже, для спостережень y_i лог-імовірність LL_i була б
if y_i < .001 LL+=log(cumd_beta(.001))
else if y_i>.999 LL+=log(1.0-cum_beta(.999))
else LL+=log(beta_density(y_i))
Що мені подобається в цій моделі, це те, що якщо версія бета-регресії діє, ця модель також є дійсною, але вона знімає трохи чутливості до крайніх значень. Однак це здається таким природним підходом, що мені цікаво, чому я не знаходжу в літературі очевидних посилань. Тому моє запитання замість зміни даних, чому б не змінити модель. Модифікація даних змінює результати (виходячи з припущення, що оригінальна модель є дійсною), тоді як зміна моделі за допомогою біннінгу екстремальних значень не зміщує результати.
Можливо, є проблема, яку я не помічаю?