Ілюструючи зміщення - Variance Tradeoff на прикладі іграшки
Як зазначає @Matthew Drury, в реалістичних ситуаціях ви не можете побачити останній графік, але наступний приклад іграшки може надати візуальну інтерпретацію та інтуїцію тим, хто вважає це корисним.
Набір даних та припущення
Y випадкова величина, визначена як
- Y= s i n ( πх - 0,5 ) + ϵϵ ∼ Un i fo r m ( - 0,5 , 0,5 ) , або іншими словами
- Y= f( x ) + ϵ
хYVa r ( Y) = Va r ( ϵ ) = 112
f^( x ) = β0+ β1x + β1х2+ . . . + βpхp
Встановлення різних моделей поліномів
Інтуїтивно ви очікуєте, що крива прямої лінії погано працює, оскільки набір даних явно нелінійний. Аналогічно, розміщення полінома дуже високого порядку може бути надмірним. Ця інтуїція відображена на графіку нижче, де показані різні моделі та відповідні їм середньоквадратичні помилки для даних поїздів та випробувань.
Наведений вище графік працює для одного розрізу поїздів / тестів, але як ми можемо знати, чи він узагальнений?
Оцінка очікуваного поїзда та випробування MSE
Тут у нас є багато варіантів, але один підхід полягає в тому, щоб випадковим чином розділити дані між поїздами / випробуваннями - підходити до моделі на заданий розділ і повторювати цей експеримент багато разів. Отриманий MSE можна побудувати на графіку, а середнє значення - це оцінка очікуваної помилки.
Цікаво побачити, що тестовий MSE дивовижно коливається для різних розділів даних поїздів / тестів. Але взяття середнього показника на достатньо великій кількості експериментів дає нам кращу впевненість.
Y
Зміщення - варіаційний декомпозиція
Як пояснено тут, MSE можна розділити на 3 основні компоненти:
Е[ ( Y- f^)2] = σ2ϵ+ Б я з с2[ ф^] + Va r [ f^]
Е[ ( Y- f^)2] = σ2ϵ+ [ ф- Е[ ф^] ]2+ Е[ ф^- Е[ ф^] ]2
Де в нашому випадку з іграшками:
- f
- σ2ϵϵ
- Е[ ф^]
- f^
- Е[ ф^- Е[ ф^] ]2
Надаючи наступне відношення
Примітка. На наведеному вище графіку використовуються дані тренувань, щоб відповідати моделі, а потім обчислюють MSE на тесті поїзд + .