У мене в голові з'явилася якась плутанина щодо двох типів оцінювачів популяційного значення коефіцієнта кореляції Пірсона.
А. Фішер (1915) показав, що для біваріантної нормальної популяції емпіричний є негативно упередженим оцінником , хоча зміщення може бути практично значним лише для невеликого розміру вибірки ( ). Зразок r недооцінює \ rho в тому сенсі, що він ближче до 0, ніж \ rho . ( За винятком , коли останній 0 або \ ч 1 , за те г об'єктивний.) Кілька майже незсунені оцінки з \ Rho було запропоновано, краще один , ймовірно , бути Olkin і Пратт (1958)виправлено :
В. Кажуть, що в регресії, що спостерігається, завищує відповідну сукупність R-квадратів. Або, за допомогою простого регресу, це те, що завищує . Грунтуючись на цьому факті, я бачив багато текстів говорять , що є позитивно упередженим по відношенню до , тобто абсолютне значення: далі від , ніж (? В тому , що твердження вірне). У текстах йдеться про ту саму проблему, що і завищена оцінка параметра стандартного відхилення за значенням його вибірки. Існує багато формул, щоб "скорегувати" спостережуваний ближче до його параметру сукупності, Wherry's (1931) є найбільш відомим (але не найкращим). Корінь такого скоригованого називається скороченим :
В даний час є два різні оцінки . Дуже різна: перша надуває , друга - . Як їх узгодити? Де використовувати / повідомити одне, а де - інше?
Зокрема, чи може бути правдою, що оцінювач "зменшеного" також є (майже) неупередженим, як "неупереджений", але лише в іншому контексті - в асиметричному контексті регресії. Тому що в регресії OLS ми вважаємо значення однієї сторони (предиктора) фіксованими, відвідуючи без випадкової помилки від вибірки до вибірки? (І додати тут, регресія не потребує двовимірної нормальності.)