Чому оцінку Джеймса-Штейна називають оцінкою "усадки"?


19

Я читав про оцінку Джеймса-Штейна. У цій примітці вона визначена як

θ^=(1-p-2Х2)Х

Я прочитав доказ, але не розумію наступного твердження:

Геометрично оцінювач Джеймса – Штейна зменшує кожну складову напрямку походження ...Х

Що саме означає "скорочення кожного компонента Х до початку"? Я думав про щось на кшталт

θ^-02<Х-02,
що в цьому випадку справедливо до тих пір, поки (p+2)<Х2 , оскільки
θ^=Х2-(p+2)Х2Х.

Це те, що люди мають на увазі, коли вони говорять "зменшитись до нуля", оскільки в сенсі норми L2 оцінка JS ближче до нуля, ніж Х ?

Оновлення станом на 22.09.2017 : Сьогодні я зрозумів, що, можливо, надто ускладнюю речі. Здається, люди насправді означають, що раз ви помножите Х на щось менше, ніж 1 , а саме термін Х2-(p+2)Х2 , кожен компонент Х буде меншим, ніж раніше.

Відповіді:


31

Малюнок іноді коштує тисячі слів, тому дозвольте мені поділитися з вами. Нижче ви можете побачити ілюстрацію, що виходить із статті Бредлі Ефрона (1977) про парадокс Штейна у статистиці . Як бачите, те, що оцінювач Штейна робить, це перенести кожне зі значень ближче до величини середньої величини. Це робить значення більші за середнє значення менше, а значення, менші за середнє значення, більше. Під усадкою ми маємо на увазі переміщення значень до середнього , або до нуля в деяких випадках - як регульована регресія -, що зменшує параметри до нуля.

Ілюстрація оцінки Штейна від Efron (1977)

Звичайно, мова йде не лише про скорочення самого себе, але те, що довели Штейн (1956) та Джеймс і Штейн (1961) , - це те, що оцінювач Штейна домінує в оцінці максимальної ймовірності з точки зору загальної квадратичної помилки,

Емк(мк^JS-мк2)<Емк(мк^МLЕ-мк2)

де , - оцінювач Штейна і , де обидва оцінки оцінюються на вибірці . Докази наведені в оригінальних документах та додатку до статті, на яку ви посилаєтесь. У звичайній англійській мові вони показали, що якщо ви одночасно робите відгадок, то, з точки зору загальної помилки у квадраті, вам краще зробити їх, скоротивши їх, порівняно з дотриманням своїх початкових здогадок.мк=(мк1,мк2,,мкp)'мк^iJSмк^iМLЕ=хiх1,х2,,хpp>2

Нарешті, оцінювач Штейна, безумовно, не єдиний оцінювач, який дає ефект усадки. Для інших прикладів ви можете перевірити цю запис у блозі чи згадувану Байєсівську книгу аналізу даних Gelman et al. Ви також можете перевірити теми щодо регульованої регресії, наприклад, яку проблему вирішують методи усадки? або Коли використовувати методи регуляризації для регресії? , для інших практичних застосувань цього ефекту.


Стаття здається корисною, і я її прочитаю. Я оновив своє запитання, щоб далі пояснити свої думки. Не могли б ви поглянути? Спасибі!
3x89g2

2
@Tim Я думаю, що аргумент Місакова є правомірним тим, що оцінювач Джеймса-Штейна наближає оцінку до нуля, ніж MLE. Нуль відіграє центральну і центральну роль у цьому оцінювачі, і оцінювачі Джеймса-Штейна можуть бути побудовані, що скорочуються до інших центрів або навіть підпросторів (як у Джордж, 1986). Наприклад, Ефрон і Морріс (1973) скорочуються до загальної середньої величини, яка становить діагональний підпростір. θ
Сіань
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.