АРС та регресія хребта можуть бути сумісні, коли зроблені певні припущення. Однак не існує єдиного методу вибору усадки для регресії хребта, тому немає загального способу застосування АПК до неї. Регресія хребта - це підмножина регуляризації Тихонова . Існує багато критеріїв, які можна застосувати для вибору факторів згладжування для регуляризації Тихонова, наприклад, див. Це . Для використання AIC в цьому контексті є документ, який робить досить конкретні припущення щодо того, як виконати цю регуляризацію, вибір параметрів регуляризації, заснованої на інформаційній складності, для вирішення погано обумовлених зворотних задач . Зокрема, це передбачає
"У статистичних рамках ... вибираючи значення параметра регуляризації α і використовуючи метод максимальної пеніальної ймовірності (MPL) .... Якщо ми розглянемо некорельований гауссовий шум з дисперсією і використовуємо штраф складна норма, див. посилання вище , MPL-рішення є таким самим, як тихоновський (1963) регульований розчин ".σ2p(x)=
Тоді виникає питання, чи варто робити ці припущення? Питання про необхідний ступінь свободи є другорядним у питанні того, чи застосовується АІК та регресія хребта у послідовному контексті. Я б запропонував прочитати посилання для деталей. Я не уникаю цього питання, це просто те, що можна використовувати багато речей у якості цілей хребта, наприклад, можна використовувати коефіцієнт згладжування, що оптимізує сам AIC . Отже, одне добре запитання заслуговує іншого: "Навіщо турбуватися з AIC в контексті хребта?" У деяких контекстах регресії хребта важко зрозуміти, наскільки AIC може бути актуальним. Так , наприклад, гребінь регресія була застосована для того , щоб мінімізувати відносне поширення помилок в , тобто, хвb[SD(b)b] розподілу гамми (GD), заданого
GD(t;a,b)=1te−bt(bt)aΓ(a);t≥0,
відповідно до цього документу . Зокрема, ця трудність виникає тому , що в цій роботі, тобто, по суті, Суб'єктивна U NDER на Час C Urve (ППК) , який оптимізований, а не максимальної правдоподібності (ML) в благості між вимірюваними зразками часу. Зрозуміло, що це робиться тому, що AUC є неправомірним інтегралом, і, в іншому випадку, наприклад, використовуючи ML, гамма-розподіл придатний не матиме надійності. Таким чином, для цього конкретного застосування максимальна ймовірність, таким чином, AIC, насправді не має значення. (Кажуть, що AIC використовується для прогнозування, а BIC для корисності придатності. Однак, прогнозування та корисність придатності лише доволі опосередковано пов'язані з надійною мірою AUC.)[0,∞)[t1,tn]
Що стосується відповіді на запитання , то в першому посиланні в тексті запитання йдеться про те, що "Основна суть полягає в тому, що є функцією, що спадає [ Sic , коефіцієнт згладжування] з [ Sic , ефективне число параметрів див. матрицю капелюшкової матриці нижче] в і в . " Що означає, що дорівнює кількості параметрів мінус кількості оцінених величин, коли не відбувається згладжування, яке також є, коли регресія така ж, як звичайні найменші квадрати, і зменшується до ніdfλdf=pλ=0df=0λ=∞dfdf оскільки коефіцієнт згладжування збільшується до . Зауважте, що для нескінченного згладжування пристосування - це плоска лінія незалежно від того, яка функція щільності підходить. Нарешті, що точна кількість є функцією.∞df
"Можна показати, що
), де { } є власними значеннями Цікаво, що ця сама посилання визначає як слід матриці капелюха, див. def .dfridge=∑(λi/(λi+λλiXTXdf