Квантильна регресія не передбачає розподілу припущень, тобто припущень щодо залишків, крім припущення, що змінна реакції майже безперервна. Якщо ви вирішуєте проблему оцінки одного квантиля як предикторів функції X, далеко і далеко, головні речі, які можуть піти не так, - неправильне визначення лінійного предиктора Хβнедостатністю, тобто відсутністю включення нелінійних ефектів (поширена проблема) або ефектів взаємодії. Існує щонайменше два рекомендовані підходи. По-перше, якщо ваш розмір зразка великий, просто помістіть більш гнучку модель. Хороший компроміс полягає в тому, щоб дозволити всі основні ефекти бути нелінійними за допомогою регресійних сплайнів, таких як кубічні сплайси з обмеженим кубічним струмом (природні сплайни). Тоді нічого не потрібно перевіряти, крім взаємодій. Другий підхід - сподіватися, що модель проста (чому?), Але дозволяти їй бути складною, а потім оцінити вплив складних доповнень на просту модель. Наприклад, ми можемо оцінити комбінований внесок нелінійних або взаємодіючих термінів або те і інше. Приклад випливає, використовуючи R rms
іquantreg
пакети. Для обмеження кількості параметрів використовується компромісна форма взаємодії. Взаємодії можуть бути не подвійно нелінійними.
require(rms)
# Estimate 25th percentile of y as a function of x1 and x2
f <- Rq(y ~ rcs(x1, 4) + rcs(x2, 4) + rcs(x1, 4) %ia% rcs(x2, 4), tau=.25)
# rcs = restricted cubic spline, here with 4 default knots
# %ia% = restricted interaction
# To use general interactions (all cross product terms), use:
# f <- Rq(y ~ rcs(x1, 4)*rcs(x2, 4), tau=.25)
anova(f) # get automatic combined 'chunk' tests: nonlinearity, interaction
# anova also provides the combined test of complexity (nonlin. + interact.)