Ступінь свободи не є цілим у ряді контекстів. Дійсно, за кількох обставин ви можете встановити, що ступінь свободи пристосування даних для деяких конкретних моделей повинна бути між деяким значенням к і k + 1 .
Зазвичай ми вважаємо ступінь свободи як кількість вільних параметрів, але бувають ситуації, коли параметри не є абсолютно вільними, і їх потім важко підрахувати. Це може статися, наприклад, при згладжуванні / регуляризації.
Приклади локально зважених регресійних / ядерних методів згладжування сплайнів є прикладами такої ситуації - загальна кількість вільних параметрів - це не те, на що можна легко порахувати, додаючи прогнози, тому потрібно більш загальне уявлення про ступінь свободи.
У Узагальнених адитивних моделях , на яких gam
частково заснована, Гест і Tibshirani (1990) [1] (та й у багатьох інших посиланнях) для деяких моделей , в яких ми можемо написати у = А у , ступеня свободи іноді беруться тр ( A ) (вони також обговорюють tr ( A A T ) або tr ( 2 A - A A T ) ). Перший відповідає більш звичному підходу, коли обидва працюють (наприклад, в регресії, де в нормальних ситуаціях tr (у^= А утр( А )тр( A AТ)тр( 2 А - А АТ)тр( А ) буде розміром стовпцяХ ), але колиА симетричний і ідентичний, усі три ці формули однакові.
[У мене немає такої довідки, щоб перевірити достатньо деталей; альтернативою тих же авторів (плюс Фрідмана), з якою легко здобутись, є елементи статистичного навчання [2]; див., наприклад, рівняння 5.16, яке визначає ефективні ступені свободи згладжуючого сплайна як тр( А ) (у моєму позначенні)]
У більш загальному плані до сих пір, Е. (1998) [3] , певні узагальнені ступені свободи як ∑i∂у^i∂уi , що є сумою чутливості пристосованих значень до відповідних спостережень. У свою чергу, це узгоджується зтр( А )де це визначення працює. Для використання визначення Ye потрібно лише обчислюватиу^∂у^i∂уi
Для таких моделей, як ті, на які встановлено gam
, ці різні заходи, як правило, не є цілими.
(Я настійно рекомендую прочитати обговорення цих посилань з цього питання, хоча історія може ускладнитися в деяких ситуаціях. Див., Наприклад, [4])
[1] Хасті, Т. і Тібшірані, Р. (1990),
Узагальнені моделі адитивів
Лондон: Чапман і Холл.
[2] Хасті, Т., Тібшірані, Р. і Фрідман, Дж. (2009),
Елементи статистичного навчання: видобуток даних , умовиводи та прогнозування , 2ndEd
Springer-Verlag.
https://statweb.stanford.edu/~tibs/ElemStatLearn/
[3] Ye, J. (1998),
"Про вимірювання та корекцію ефектів видобутку даних та вибір моделей",
журнал Американської статистичної асоціації , Vol. 93, № 441, стор 120-131
[4] Janson, L., Fithian, W. and Hastie, T. (2013),
"Ефективні ступені свободи: невдала метафора"
https://arxiv.org/abs/1312.7851