Як вибрати між різними регульованими


15

Я маю на увазі скориговані формули R-квадрата, запропоновані:

  • Єзекіїль (1930), який, на мою думку, є таким, який зараз використовується в SPSS.

    Radjusted2=1(N1)(Np1)(1R2)
  • Олкін і Пратт (1958)

    Runbiased2=1(N3)(1R2)(Np1)2(N3)(1R2)2(Np1)(Np+1)

За яких обставин (якщо такі є) я повинен віддати перевагу "пристосованому" перед "неупередженим" ?R2

Список літератури

  1. Єзекіїль, М. (1930). Методи кореляційного аналізу . Джон Вілей і сини, Нью-Йорк.
  2. Олкін І., Пратт Дж. В. (1958). Об'єктивна оцінка певних кореляційних коефіцієнтів. Анали математичної статистики , 29 (1), 201-211.

Відповіді:


5

Не бажаючи брати на себе відповідальність за відповідь @ttnphns, я хотів перенести відповідь з коментарів (особливо враховуючи, що посилання на статтю померло). Відповідь Метта Крауза дає корисну дискусію про відмінність між і R 2 a d j, але в ній не обговорюється рішення, яку формулу R 2 a d j використовувати в будь-якому випадку.R2Radj2Radj2

Як я обговорюю у цій відповіді , Yin and Fan (2001) дають хороший огляд безлічі різних формул для оцінки варіабельності популяції, пояснених , які всі потенційно можуть бути позначені типом скоригованого R 2ρ2R2 .

Вони виконують моделювання для оцінки того, яка з широкого діапазону скоригованих формул r-квадрата забезпечує найкращу неупереджену оцінку для різних розмірів вибірки, та взаємозв'язків предиктора. Вони припускають, що формула Пратта може бути хорошим варіантом, але я не думаю, що дослідження було остаточним у цьому питанні.ρ2

Оновлення: Raju et al (1997) зазначають, що скориговані формули відрізняються залежно від того, чи призначені вони для оцінки скоригованого R 2, припускаючи попередників з фіксованим x або випадковим x. Зокрема, формула Єзекіаля призначена для оцінки ρ 2 у контексті фіксованого х, а формули Олкіна-Пратта і Пратта призначені для оцінки ρ 2 цієї відповіді для подальшого обговорення . Між двома типами формул також немає великої різниці, оскільки розміри вибірки набувають помірно великих розмірів (див. Тут для обговорення розміру різниці ).R2R2ρ2ρ2 в контексті випадкових x. Різниця між формулами Олкіна-Пратта і Пратта не велика. Припущення з фіксованим x вирівнюються з плановими експериментами, припущення випадкових x вирівнюються з, коли ви припускаєте, що значення змінних предиктора є вибіркою можливих значень, як це зазвичай буває в спостережних дослідженнях. Побачити

Короткий зміст правил великого пальця

  • Якщо ви припускаєте, що ваші спостереження за змінними провісника є випадковою вибіркою з популяції, і ви хочете оцінити для повної сукупності як прогнозів, так і критерію (тобто, випадкове x припущення), то використовуйте формулу Олкіна-Пратта (або формула Пратта).ρ2
  • Якщо ви припускаєте, що ваші спостереження є фіксованими або ви не хочете узагальнювати за спостережуваними рівнями передбачувача, то оцініть за формулою Єзекіїля.ρ2
  • Якщо ви хочете дізнатися про вибірка прогнозування за допомогою рівняння регресії вибірки, тоді ви хочете вивчити певну форму перехресної перевірки.

Список літератури

  • Raju, NS, Bilgic, R., Edwards, JE, & Fleer, PF (1997). Огляд методології: Оцінка обгрунтованості та перехресних дій та використання рівних ваг для прогнозування. Прикладний психологічний вимір, 21 (4), 291-305.
  • R2

13

R2R2R2R2R2

R2r2r2R2R2


2
Дякую, я виявив, що це дуже чітке пояснення різниці між R-квадратом та відрегульованим R-квадратом. На ваш погляд, як неупереджений R-квадрат вписується в цю картину?
user1205901

5
Дійсно існують різні формули для оцінки кількості населення R ^ 2. Дивіться, наприклад, studyforquals.pbworks.com/f/yin.pdf . Кажуть, що "Налагоджений R ^ 2" Фішера (трохи відхиленого R ^ 2) є дещо негативно упередженим (воно все ще залежить від розміру вибірки, не залежачи від кількості предикторів), тому версія Олкіна-Пратта, ймовірно, дещо краща.
ttnphns

1
@ttnphns, можливо, це має бути відповідь замість коментаря. Мені, здається, вирішувати оригінальне питання більше, ніж цю відповідь.
gung - Відновіть Моніку

1
R2R2

1
@ttnphns, я згоден з Гунгом! Вам слід написати відповідь і взяти кредит. Також ви можете підтвердити те, що я написав? JStor сьогодні діє дивно і не дасть мені прочитати оригінальний папір Олкіна та Пратта.
Метт Крауз
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.