Я використовую пакунок Quantreg, щоб зробити модель регресії, використовуючи 99-й перцентиль моїх значень у наборі даних. На основі порад з попереднього запитання про stackoverflow, який я задав, я використав таку структуру коду.
mod <- rq(y ~ log(x), data=df, tau=.99)
pDF <- data.frame(x = seq(1,10000, length=1000) )
pDF <- within(pDF, y <- predict(mod, newdata = pDF) )
яку я показую накресленою поверх моїх даних. Я побудував це за допомогою ggplot2 із значенням альфа для очок. Я думаю, що хвіст мого розповсюдження недостатньо розглядається в моєму аналізі. Можливо, це пов'язано з тим, що існують окремі точки, які ігноруються вимірюванням типу процентилів.
Один із коментарів підказав це
Пакетна віньєтка містить розділи про нелінійну квантильну регресію, а також моделі з вирівнюючими сплайнами тощо.
На основі свого попереднього запитання я припустив логарифмічну залежність, але я не впевнений, чи правильно це. Я думав, що зможу витягнути всі точки на інтервалі 99-го перцентиля, а потім вивчити їх окремо, але я не впевнений, як це зробити, або якщо це вдалий підхід. Буду вдячний за будь-яку пораду, як покращити виявлення цих відносин.