У мене є експеримент повторного вимірювання, де залежна змінна є відсотком, і я маю кілька факторів як незалежних змінних. Я хотів би використати glmer
з пакету R lme4
трактувати це як проблему логістичної регресії (шляхом уточнення family=binomial
), оскільки, здається, це вміщення безпосередньо відповідає.
Мої дані виглядають так:
> head(data.xvsy)
foldnum featureset noisered pooldur dpoolmode auc
1 0 mfcc-ms nr0 1 mean 0.6760438
2 1 mfcc-ms nr0 1 mean 0.6739482
3 0 melspec-maxp nr075 1 max 0.8141421
4 1 melspec-maxp nr075 1 max 0.7822994
5 0 chrmpeak-tpor1d nr075 1 max 0.6547476
6 1 chrmpeak-tpor1d nr075 1 max 0.6699825
і ось команда R, на яку я сподівався, буде доречною:
glmer(auc~1+featureset*noisered*pooldur*dpoolmode+(1|foldnum), data.xvsy, family=binomial)
Проблема в тому, що команда скаржиться на те, що моя залежна змінна не є цілими числами:
In eval(expr, envir, enclos) : non-integer #successes in a binomial glm!
і аналіз цих (пілотних) даних дає в результаті дивні відповіді.
Я розумію, чому binomial
сім'я очікує цілих чисел (так-ні рахує), але, здається, слід нормально регресувати дані про відсоток. Як це зробити?