Я шукаю розширений випадок лінійної регресії, що ілюструє кроки, необхідні для моделювання складних, декількох нелінійних зв’язків за допомогою GLM або OLS. Напрочуд складно знайти ресурси, що виходять за рамки базових шкільних прикладів: більшість прочитаних книг не піде далі, ніж перетворення журналу відповіді, поєднане з BoxCox одного прогноктора, або природний сплайн у кращому випадку. Також усі приклади, які я бачив до цього часу, підходять до кожної проблеми трансформації даних в окремій моделі, часто в одній моделі передбачення.
Я знаю, що таке трансформація BoxCox або YeoJohnson. Я шукаю детальне реальне тематичне дослідження, де відповідь / взаємозв'язок не є чіткими. Наприклад, реакція не є суто позитивною (тому ви не можете використовувати журнал або BoxCox), у передбачувачів є нелінійні зв’язки між собою та проти відповіді, а максимальна ймовірність перетворень даних, схоже, не передбачає стандартних 0,33 або 0,5 показника. Також залишкова дисперсія виявляється непостійною (вона ніколи не буває), тому відповідь має бути також трансформована, і вибір повинен бути зроблений між нестандартною регресією сімейства GLM або перетворенням відповіді. Дослідник, ймовірно, зробить вибір, щоб уникнути перевиконання даних.
EDIT
Поки я зібрав такі ресурси:
- Стратегії моделювання регресії, Ф. Харрелл
- Прикладний економетричний часовий ряд, В. Ендерс
- Динамічні лінійні моделі з R, G. Petris
- Прикладний регресійний аналіз, Д. Клейнбаум
- Вступ до статистичного навчання, Г. Джеймс / Д. Віттен
Я читаю лише останній (ISLR), і це дуже хороший текст (5 годин зірок на моєму годиннику), хоча більше орієнтований на ML, ніж на прогресивне регресійне моделювання.
Є також цей хороший пост у резюме, який представляє складний випадок регресії.