Shrunken vs unbiased : оцінювачі


22

У мене в голові з'явилася якась плутанина щодо двох типів оцінювачів популяційного значення коефіцієнта кореляції Пірсона.

А. Фішер (1915) показав, що для біваріантної нормальної популяції емпіричний є негативно упередженим оцінником , хоча зміщення може бути практично значним лише для невеликого розміру вибірки ( ). Зразок r недооцінює \ rho в тому сенсі, що він ближче до 0, ніж \ rho . ( За винятком , коли останній 0 або \ ч 1 , за те г об'єктивний.) Кілька майже незсунені оцінки з \ Rho було запропоновано, краще один , ймовірно , бути Olkin і Пратт (1958)rρn<30rρ0ρ0±1rρвиправлено r :

runbiased=r[1+1r22(n3)]

В. Кажуть, що в регресії, що спостерігається, R2 завищує відповідну сукупність R-квадратів. Або, за допомогою простого регресу, це те, що r2 завищує ρ2 . Грунтуючись на цьому факті, я бачив багато текстів говорять , що r є позитивно упередженим по відношенню до ρ , тобто абсолютне значення: r далі від 0 , ніж ρ (? В тому , що твердження вірне). У текстах йдеться про ту саму проблему, що і завищена оцінка параметра стандартного відхилення за значенням його вибірки. Існує багато формул, щоб "скорегувати" спостережуваний R2 ближче до його параметру сукупності, Wherry's (1931) Radj2 є найбільш відомим (але не найкращим). Корінь такого скоригованого radj2 називається скороченим r :

rshrunk=±1(1r2)n1n2

В даний час є два різні оцінки ρ . Дуже різна: перша надуває r , друга - r . Як їх узгодити? Де використовувати / повідомити одне, а де - інше?

Зокрема, чи може бути правдою, що оцінювач "зменшеного" також є (майже) неупередженим, як "неупереджений", але лише в іншому контексті - в асиметричному контексті регресії. Тому що в регресії OLS ми вважаємо значення однієї сторони (предиктора) фіксованими, відвідуючи без випадкової помилки від вибірки до вибірки? (І додати тут, регресія не потребує двовимірної нормальності.)


Цікаво, чи це просто зводиться до чогось, що ґрунтується на нерівності Дженсена. Та й двовимірна нормальність, мабуть, є поганим припущенням у більшості випадків.
shadowtalker

1
Крім того, моє розуміння проблеми в Б. полягає в тому, що регресія r2 є завищеною, оскільки регресійний прийом можна вдосконалити довільно, додавши предиктори. Мені це не здається таким же питанням, як у А.
shadowtalker

Чи дійсно правда, що є позитивно упередженою оцінкою для всіх значень ? Для двовимірного нормального розподілу , це не здається, випадок для досить великий. r2ρ2ρρ
NRH

Чи може зміщення йти у зворотному напрямку для квадрата оцінювача? Наприклад, за допомогою більш простого оцінювача може бути показано, що для деяких діапазонів ? Я думаю, що це було б важко зробити, якби , але, можливо, може бути розроблений більш простий приклад. E[θ^θ]<0<E[θ^2θ2]θθ=ρ
Антоній

Відповіді:


1

Щодо зміщення кореляції: Коли розміри вибірки досить малі, щоб ухил мав якесь практичне значення (наприклад, n <30, який ви запропонували), то зміщення, ймовірно, буде найменшим з ваших турбот, оскільки неточність є жахливою.

Що стосується зміщення R 2 при множинній регресії, то існує багато різних коригувань, які стосуються неупередженої оцінки популяції порівняно з неупередженою оцінкою в незалежній вибірці однакового розміру. Див. Yin, P. & Fan, X. (2001). Оцінка усадки R 2 при множинній регресії: порівняння аналітичних методів. Журнал експериментальної освіти, 69, 203-224.

Сучасні методи регресії також стосуються усадки коефіцієнтів регресії, а також R 2 як наслідок - наприклад, пружна сітка з k- кратною перехресною валідацією, див. Http://web.stanford.edu/~hastie/Papers/ elanetnet.pdf .


1
Я не знаю, чи це насправді відповідає на питання
shadowtalker

1

Я думаю, що відповідь полягає в контексті простої регресії та множинної регресії. У простому регресії з одним IV та одним DV, R sq не є позитивно зміщеним, і насправді може бути негативно зміщеним, якщо r є негативно зміщеним. Але при множинній регресії з декількома IV, які можуть бути корельовані між собою, R sq може бути позитивно упередженим через будь-яке «придушення», яке може статися. Таким чином, я вважаю, що спостерігається R2 завищує відповідний R-квадрат популяції, але лише при множинній регресії


1
R sq is not positively biased, and in-fact may be negatively biasedЦікаво. Ви можете це показати чи дати посилання? - Чи може у біваріантній нормальній популяції статистика зразка Rsq бути негативно упередженою оцінкою?
ttnphns

Я думаю, ви помиляєтесь. Чи можете ви надати посилання на резервне копіювання своєї претензії?
Річард Харді

Вибачте, але це було більше вдумкою, тому я не маю посилання.
Дінгус

Я відходив від коментаря А вище, де Фішер показав, що в нормальній ситуації, що відрізняється від норми, r є негативно упередженим оцінником rho. Якщо це так, чи не випливало б, що R sq також негативно зміщений?
Дінгус

Можливо, це допоможе в розмові digitalcommons.unf.edu/cgi/…
Dingus
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.