Ви не робите перетворення logit, щоб зробити змінну від мінус нескінченності до плюс нескінченності? Я не впевнений, чи мають бути дані, що мають 0 та 1. Це відображає повідомлення про помилку? До речі, якщо у вас тільки пропорції, ваш аналіз завжди вийде неправильним. Ви повинні використовувати , weight=argument
щоб glm
з числом випадків.
Якщо нічого не працює, ви можете використовувати медіанний розкол або четвертий розкол або будь-яку точку зрізу, яку ви вважаєте за потрібне розділити DV на кілька категорій, а потім замість цього виконати звичайну логістичну регресію. Це може спрацювати. Спробуйте ці речі.
Я особисто не вважаю, що додавання 0,001 до нулів і взяття 0,001 з них - це занадто погана ідея, але у нього є деякі проблеми, про які піде мова пізніше. Подумайте, чому б вам не додати і відняти 0,000000001 (або навіть більше десяткових знаків)? Це буде краще представляти 0 і 1 !! Вам може здатися, що це не має великого значення. Але це насправді так.
Давайте подивимось наступне:
> #odds when 0 is replaced by 0.00000001
> 0.00000001/(1-0.00000001)
[1] 1e-08
> log(0.00000001/(1-0.00000001))
[1] -18.42068
> #odds when 1 is replaced by (1-0.00000001):
> (1-0.00000001)/(1-(1-0.00000001))
[1] 1e+08
> log((1-0.00000001)/(1-(1-0.00000001)))
[1] 18.42068
> #odds when 0 is replaced by 0.001
> 0.001/(1-0.001)
[1] 0.001001001
> log(0.001/(1-0.001))
[1] -6.906755
> #odds when 1 is replaced by (1-0.001):
> (1-0.001)/(1-(1-0.001))
[1] 999
> log((1-0.001)/(1-(1-0.001)))
[1] 6.906755
Отже, бачите, шанси потрібно тримати так само, як (0/1) та (1/0). Ви очікуєте, що коефіцієнт журналу коливається від мінус нескінченності до плюс нескінченності. Отже, щоб додати або відняти, вам потрібно вибрати до дійсно дійсно довгого десяткового знаку, щоб шанси журналу стали близькими до нескінченності (або дуже великої) !! Те, наскільки ви вважаєте себе досить великим, залежить виключно від вас.