На це запитання було чітко відповідено в класичній серії робіт про оцінку Джеймса-Штейна в контексті "Емпіричного Байєса", написаній в 1970-х роках "Ефроном та Моррісом". В основному я маю на увазі:
Ефрон і Морріс, 1973, Правило оцінки Штейна та його конкуренти - емпіричний підхід Байєса
Efron and Morris, 1975, Аналіз даних за допомогою Оцінювача Штейна та його узагальнення
Ефрон і Морріс, 1977, Парадокс Штейна в статистиці
Документ 1977 року - це нетехнічна експозиція, яку обов'язково потрібно прочитати. Там вони вводять приклад бейсбольного ватання (про що йде мова в потоці, до якого ви пов’язані); у цьому прикладі відхилення спостереження дійсно повинні бути рівними для всіх змінних, а коефіцієнт усадки постійний.c
Однак вони продовжують наводити інший приклад, який оцінює показники токсоплазмозу в ряді міст Сальвадору. У кожному місті було обстежено різну кількість людей, і тому окремі спостереження (рівень токсоплазмозу в кожному місті) можна вважати різними варіаціями (чим менша кількість обстежених людей, тим більша дисперсія). Інтуїція, безумовно, полягає в тому, що точки даних з низькою дисперсією (низькою невизначеністю) не потрібно стискати так сильно, як точки даних з великою дисперсією (висока невизначеність). Результат їх аналізу показаний на наступному малюнку, де це дійсно можна побачити:
Ці ж дані та аналіз представлені в набагато більш технічному документі 1975 року, і в набагато більш елегантній фігурі (на жаль, не показуючи окремих варіацій), див. Розділ 3:
Там вони представляють спрощене емпіричне лікування Байєса, яке йде наступним чином. Нехай де невідомо. У випадку, коли всі однакові, стандартне емпіричне лікування Байєса полягає в оцінці як , а також обчислення середнього рівня після як що нічого інше, ніж оцінювач Джеймса-Штейна.Xi|θi∼N(θi,Di)θi∼N(0,A)
ADi=11/(1+A)(k−2)/∑X2jθiθ^i=(1−11+A)Xi=(1−k−2∑X2j)Xi,
Якщо зараз , то правило оновлення Байєса є і ми можемо використовувати той самий емпіричний трюк Байєса для оцінки , навіть якщо в цьому випадку немає закритої формули для (див. папір). Однак вони зазначають цеDi≠1θ^i=(1−DiDi+A)Xi
AA^
... це правило не зводиться до Штейна, коли всі рівні, і ми натомість використовуємо другорядний варіант цього оцінювача, похідний у [документі 1973 р.], який редукує до Штейна. Правило варіанту оцінює різне значення для кожного міста. Різниця між правилами в цьому випадку незначна, але може бути важливим, якби було меншим.DjA^ik
Відповідний розділ у документі 1973 р. - Розділ 8, і він трохи жорсткіше читає. Цікаво, що вони мають чіткий коментар до пропозиції, яку висловив @guy в коментарях вище:
Дуже простий спосіб узагальнити правило Джеймса-Штейна для цієї ситуації - визначити , так що , застосувати [оригінальне правило Джеймса-Штейна] до перетворених даних, а потім перетворити назад до початкових координат. Отримане правило оцінює по
Це непривабливо, оскільки кожен скорочується до початку за одним і тим же фактором.x~i=D−1/2ixi,θ~i=D−1/2iθix~i∼N(θ~i,1)θi θ я=(1-до-2θ^i=(1−k−2∑[X2j/Dj])Xi.
XiXi
Потім вони продовжують описувати свою кращу процедуру оцінки яку, маю визнати, я не повністю прочитав (це трохи пов'язано). Я пропоную вам заглянути там, якщо вас цікавлять деталі.A^i