Яка залежність між


17

Мені було цікаво, чи існує зв’язок між та F-тестом.R2

Як правило ,

R2=(Y^tY¯)2/T1(YtY¯)2/T1
і вимірює силу лінійної залежності в регресії.

F-тест просто доводить гіпотезу.

Чи існує взаємозв'язок між R2 і F-тестом?


2
Формула для виглядає невірно, не лише тому, що в знаменнику відсутні деякі символи: ці терміни " - 1 " не належать. Правильна формула набагато більше нагадує статистику F :-). R21F
whuber

Відповіді:


23

Якщо всі припущення мають місце і у вас є правильна форма для то звичайну статистику F можна обчислити як F = R 2R2 . Потім це значення можна порівняти з відповідним розподілом F, щоб зробити F-тест. Це можна отримати / підтвердити за допомогою основної алгебри.F=R21R2×df2df1


2
Ви можете, будь ласка, визначити df1 та df2?
bonobo

1
@bonobo, df1 - це чисельність ступенів свободи (виходячи з кількості предикторів), а df2 - знаменник ступенів свободи.
Грег Сніг

1
Щоб уточнити далі про ступеня свободи: df1 = k, де k - кількість предикторів. df1 називається "чисельністю ступенів свободи", навіть якщо це знаменник у цій формулі. df2 = n− (k + 1), де n - кількість спостережень і k - кількість предикторів. df2 називають "знаменниками ступенів свободи", навіть якщо це в чисельнику у цій формулі.
Тім Сваст

5
@GregSnow Ви могли б розглянути можливість додавання визначень ступенів свободи до відповіді? Я запропонував таку зміну на stats.stackexchange.com/review/sugges-edits/175306, але її було відхилено.
Тім Сваст

22

Нагадаємо, що в умовах регресії статистика F виражається наступним чином.

F=(TSSRSS)/(p1)RSS/(np)

де TSS = загальна сума квадратів і RSS = залишкова сума квадратів, - кількість предикторів (включаючи постійну) і n - кількість спостережень. Ця статистика має розподіл F зі ступенями свободи p - 1 і n - p .pnFp1np

Згадайте також, що

R2=1RSSTSS=TSSRSSTSS

проста алгебра скаже вам, що

R2=1(1+Fp1np)1

де F - статистика F зверху.

Це теоретичний взаємозв'язок між статистикою F (або тестом F) і .R2

Практична інтерпретація полягає в тому, що більший призводить до високих значень F, тому якщо R 2 великий (це означає, що лінійна модель добре відповідає даним), то відповідна статистика F повинна бути великою, що означає, що є надійним доказом того, що принаймні деякі коефіцієнти не дорівнюють нулю.R2R2



-1

Також швидко:

R2 = F / (F + np / p-1)

Наприклад, R2 тесту 1df F = 2,53 з розміром вибірки 21, буде:

R2 = 2,53 / (2,53 + 19) R2 = .1175


1
Я не бачу, як це додає нічого, крім того, що вже є у відповіді Чжен Лі.
Glen_b -Reinstate Monica
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.