Я знайшов можливі суперечливі визначення для статистики перехресної перевірки (CV) та для статистики узагальненої перехресної валідації (GCV), пов'язаної з лінійною моделлю (з нормальним вектором помилок гомоскедастичної помилки \ boldsymbol \ varepsilon ).ε
З одного боку, Голуб, Хіт і Вахба визначають оцінку GCV як (стор. 216)
мінімізатор заданий
де
З іншого боку, Ефрон визначає те саме поняття, що і (стор. 24), але він пов'язує введення цієї концепції з Craven & Wahba, де її визначення (стор. 377) є по суті тим самим. як вищезгадане визначення Голуба, Хіт і Вахби.
Чи означає це, що мінімізує ?
Аналогічно, Golub, Heath & Wahba визначають оцінку CV (стор. 217) як мінімізатор
де - оцінка
з з - й точкою даних опущений.
Автори пов'язують введення оцінки CV (також її називають оцінкою PRESS) Аллену («PRESS Allen's», там же). Однак у роботі Аллена оцінка PRESS визначається (стор. 126) як (у статті Ефрона вона визначається як (стор. 24)).
Знову ж, чи означає це, що мінімізує ?
Аллен, Девід М. Взаємозв'язок між змінним вибором та агрегуванням даних та методом прогнозування. Технометрія, Вип. 16, № 1 (лютий 1974 р.), Стор 125-127
Craven, Peter and Wahba, Grace. Згладжування шумових даних із сплайновими функціями. Numerische Mathematik 31, (1979), стор 377-403
Ефрон, Бредлі. Наскільки виправданим є показник явної помилки логістичної регресії? Технічний звіт № 232. Кафедра статистики Стенфордського університету (квітень 1985 р.)
Голуб, Джин Х., Хіт і Грейс Вахба. Узагальнена перехресна валідація як метод вибору хорошого параметра хребта. Технометрія, Вип. 21, № 2 (травень 1979 р.), Стор 215-223