Я не маю на увазі конкретного прикладу чи завдання. Я просто новачок у використанні b-сплайнів і хотів краще зрозуміти цю функцію в контексті регресії.
Давайте припустимо , що ми хочемо , щоб оцінити залежність між змінним відгуком і деякі провісники х 1 , х 2 , . . . , х стор . Провідники включають деякі числові змінні, а також деякі категоричні.
Скажімо, що після установки регресійної моделі одна з числових змінних, наприклад є значною. Логічним кроком після цього є визначення того, чи потрібні поліноми вищого порядку, наприклад: x 2 1 і x 3 1 , щоб адекватно пояснити зв'язок без надмірного розміщення.
Мої запитання:
У який момент ви вибрали між b-сплайнами або простим многочленом вищого порядку. наприклад в R:
y ~ poly(x1,3) + x2 + x3
проти
y ~ bs(x1,3) + x2 + x3
Як ви можете використовувати сюжети, щоб повідомити про свій вибір між цими двома та про те, що станеться, якщо з графіків це не зовсім зрозуміло (наприклад: через велику кількість точок даних)
Як би ви оцінили умови двосторонньої взаємодії між та скажімо x 3
Як змінюються вищезазначені для різних типів моделей
Чи вважаєте ви, що ніколи не використовуєте поліноми високого порядку та завжди підходимо до b-сплайнів та штрафуєте за високу гнучкість?
mgcv
, чому б не використовувати (узагальнені) моделі добавок. Вибір гладкості автоматичний, а інфекційні методи добре розвинені.