Перехресне підтвердження (CV) та узагальнена статистика перехресної перевірки (GCV)


23

Я знайшов можливі суперечливі визначення для статистики перехресної перевірки (CV) та для статистики узагальненої перехресної валідації (GCV), пов'язаної з лінійною моделлю (з нормальним вектором помилок гомоскедастичної помилки \ boldsymbol \ varepsilon ).εY=Xβ+εε

З одного боку, Голуб, Хіт і Вахба визначають оцінку GCV λ^ як (стор. 216)

мінімізатор V(λ) заданий

V(λ)=1n(IA(λ))y2(1ntr(IA(λ)))2
де A(λ)=X(XTX+nλI)1XT

З іншого боку, Ефрон визначає те саме поняття, що і V(0) (стор. 24), але він пов'язує введення цієї концепції з Craven & Wahba, де її визначення (стор. 377) є по суті тим самим. як вищезгадане визначення Голуба, Хіт і Вахби.

Чи означає це, що 0 мінімізує V(λ) ?

Аналогічно, Golub, Heath & Wahba визначають оцінку CV λ (стор. 217) як мінімізатор

P(λ)=1nk=1n([Xβ(k)(λ)]kyk)2

де β(k)(λ) - оцінка

β^(λ)=(XTX+nλI)1XTy

з β з k - й точкою даних yi опущений.

Автори пов'язують введення оцінки CV (також її називають оцінкою PRESS) Аллену («PRESS Allen's», там же). Однак у роботі Аллена оцінка PRESS визначається (стор. 126) як nP(0) (у статті Ефрона вона визначається як P(0) (стор. 24)).

Знову ж, чи означає це, що 0 мінімізує P(λ) ?


  1. Аллен, Девід М. Взаємозв'язок між змінним вибором та агрегуванням даних та методом прогнозування. Технометрія, Вип. 16, № 1 (лютий 1974 р.), Стор 125-127

  2. Craven, Peter and Wahba, Grace. Згладжування шумових даних із сплайновими функціями. Numerische Mathematik 31, (1979), стор 377-403

  3. Ефрон, Бредлі. Наскільки виправданим є показник явної помилки логістичної регресії? Технічний звіт № 232. Кафедра статистики Стенфордського університету (квітень 1985 р.)

  4. Голуб, Джин Х., Хіт і Грейс Вахба. Узагальнена перехресна валідація як метод вибору хорошого параметра хребта. Технометрія, Вип. 21, № 2 (травень 1979 р.), Стор 215-223


7
Ви забули згадати, що це буде відповідати регресії хребта і не в останню чергу квадратів? Мене зовсім збентежило те, що таке поки я не побачив заголовків паперу внизуλ
shadowtalker

1
Вилучіть у заголовку генералізовану перехресну перевірку та додайте у назву регрес-хребет. Ось для чого за замовчуванням GridSearchCV () для RidgeCV ():
HoofarLotusX

Відповіді:


2

Я вважаю, що коментарі вказують на відповідь, але не заявляють це прямо. Тож я буду тупим.

Цитувана тут формула V характерна для лінійної регресії хребта. Вони не кажуть, що це те саме, що і PRESS, вони говорять про версію PRESS, що інвартує ротацію. «Обертально-інваріантна» частина - це те, що робить це узагальненим.

У статті Ефрона йдеться про логістичну регресію, адаптовану до цього контексту. Якщо ви хочете побачити математичний переклад між двома контекстами, правильною книгою для читання є Елементи статистичного навчання, 2ed, від Hastie, Tibshirani та Freedman. Вони пропонують цю книгу безкоштовно в Інтернеті: https://web.stanford.edu/~hastie/Papers/ESLII.pdf . Ще одне корисне читання на GCV - це узагальнені моделі добавок від Simon Wood. Його лікування інтегрує GCV загалом із застосуванням у регресії та логістичній регресії.

Якщо ви подивитеся на книгу ESL, стор. 244, ви бачите в основному ту саму символіку. Вони посилаються на той великий матричний продукт, який у вас є як матриця Smoother (я б сказав, це матриця Hat, або близький родич). Вони описують Smoother як відображення від доSyy^

y^=Sy

S можна використовувати для обчислення залишених значень CV, по одному для кожного рядка даних. Для лінійних моделей , то матриця грає роль матриці Hat у регресійній діагностики. Однак вони кажуть, що це може бути обчислювально складним чи непотрібним, і підхід GCV є дещо більш загальною версією тієї самої ідеї.S

Вони пропонують формулу наближення GCV:

GCV(f^)=1Ni=1N[yif^(xi)1trace(S)/N]2

Це досить схоже за поведінкою на АПК у багатьох моделях. Шлях - ефективна кількість параметрів.traceS

частина ви процитувати в більш загальному слід . Наскільки я можу зрозуміти, абстрактний GCV є приблизною версією виключення перехресної перевірки, але в деяких випадках (я вважаю, регресія хребта) це точно. Це головний момент у роботі Голуба.nλS

Удачі, напишіть, якщо ви дізнаєтесь більше.


Спасибі. Я розміщував своє запитання понад 5 років тому, і з тих пір я забув більшу частину цього матеріалу, тому не можу оцінити вашу відповідь, щоб сказати, чи добре це (начебто) чи погано, і, з цієї причини Я також не можу його прийняти. Дякую за публікацію. Сподіваємось, це буде корисно для інших, хто може натрапити на цю сторінку.
Еван Аад
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.