Я працюю над моделлю прогнозних витрат, де вік пацієнта (ціла кількість, виміряна в роках) є однією із змінних прогнозів. Очевидна сильна нелінійна залежність між віком та ризиком перебування у лікарні:
Я розглядаю санкціоновану сплайсинг згладжування регресії для віку пацієнта. Згідно з елементами статистичного навчання (Hastie et al, 2009, с.151), оптимальне розміщення вузлів - один вузол на унікальне значення віку члена.
Зважаючи на те, що я зберігаю вік як ціле число, чи санкціонований сплайнінг сплайну еквівалентний виконанню регресії хребта або ласо з 101 різними змінними вікових показників, одне на вікове значення, знайдене в наборі даних (мінус одне для довідки)? Потім уникнути надмірної параметризації, оскільки коефіцієнти кожного показника віку зменшуються до нуля.