Чи скоригований R-квадрат прагне оцінити фіксований бал чи випадкову сукупність балів r-квадрат?


9

Населення r-квадрат ρ2 можна визначити, якщо взяти фіксовані або випадкові бали:

  • Фіксовані бали: розмір вибірки та конкретні значення прогнозів утримуються фіксованими. Таким чином,ρf2 - частка дисперсії, поясненої в результаті, рівнянням регресії сукупності, коли значення предиктора підтримуються постійними.

  • Випадкові бали: Конкретні значення прогнозів виводяться з розподілу. Таким чином,ρr2 відноситься до частки дисперсії, поясненої підсумком у сукупності, де значення предиктора відповідають розподілу популяції прогнозів.

Я раніше запитував про те, чи має це відмінність велика різниця в оцінкахρ2. Я також запитував взагалі про те, як розрахувати об'єктивну оцінку ρ2.

Я бачу, що в міру збільшення вибірки розмір вибірки між фіксованою та випадковою оцінкою стає менш важливим. Однак я намагаюся підтвердити, чи налаштованоR2 призначений для оцінки фіксованого або випадкового балу ρ2.

Запитання

  • Коригується R2 призначений для оцінки фіксованого або випадкового балу ρ2?
  • Чи є принципове пояснення того, як формула для скоригованого r-квадрата стосується тієї чи іншої форми ρ2?

Передумови моєї плутанини

Коли я читаю Yin and Fan (2001, с.206), вони пишуть:

Одним з основних припущень моделі множинної регресії є те, що значення незалежних змінних є відомими константами і фіксуються дослідником перед експериментом. Тільки залежна змінна може змінюватись від вибірки до вибірки. Ця модель регресії називається фіксованою лінійною регресійною моделлю .

Однак у соціальних та поведінкових науках значення незалежних змінних рідко фіксуються дослідниками, а також зазнають випадкових помилок. Тому запропонована друга модель регресії для додатків, в якій дозволено змінюватись як залежні, так і незалежні змінні (Binder, 1959; Park & ​​Dudycha, 1974). Ця модель називається випадковою моделлю (або корекційною моделлю). Хоча максимальні оцінки ймовірності коефіцієнтів регресії, отримані з випадкової та фіксованої моделі, однакові за припущеннями про нормальність, їх розподіли дуже різні. Випадкова модель настільки складна, що потрібно більше досліджень, перш ніж її можна буде прийняти замість загальновживаної лінійної регресійної моделі. Тому зазвичай застосовується нерухома модель, навіть коли припущення не виконуються повністю (Claudy, 1978). Такі застосування моделі фіксованої регресії з порушеними припущеннями можуть спричинити "перевитрату", оскільки випадкова помилка, внесена з даних, що не досконалі, ніж вибірки, має тенденцію до використання великої літери. В результаті отриманий таким чином коефіцієнт множинної кореляції вибірки, як правило, переоцінює справжню множинну кореляцію популяції (Claudy, 1978; Cohen & Cohen, 1983; Cummings, 1982).

Тому мені не було зрозуміло, чи сказане вище твердження коригується R2 компенсує помилку, введену випадковою моделлю, чи це був лише застереження у папері, що позначає існування випадкової моделі, але те, що папір збирається зосередити увагу на нерухомій моделі.

Список літератури

  • Інь, П., І Вентилятор, X. (2001). ОцінкаR2усадка при множинній регресії: порівняння різних аналітичних методів. Журнал експериментальної освіти, 69 (2), 203-224. PDF

Відповіді:


6

Raju et al (1997) зазначають, що

Педхазур (1982) та Мітчелл та Клімоськи (1986) стверджували, що на результати
відносно не впливає модель [фіксований х або випадковий х], обрана тоді, коли N мають принаймні середній розмір (приблизно 50).

Тим не менше, Раджу та ін (1997) класифікують деякі коригувані R2 формули для оцінки ρ2 як "Виправлені формули X" і "Випадкові формули X".

Виправлені формули X: згадується кілька формул, включаючи формулу, запропоновану Єзекіїлем (1930), яка є стандартною у більшості статистичних програм:

ρ^(Е)2=1-N-1N-p-1(1-R2)

Таким чином, коротка відповідь на питання - це скоригований стандартR2 Формула, як правило, повідомляється і вбудовується в стандартне статистичне програмне забезпечення - це оцінка фіксованого x ρ2.

Випадкові формули X:

Олкін і Пратт (1958) запропонували формулу

ρ^(ОП)2=1-[N-3N-p-1](1-R2)Ж[1,1;N-p+12;(1-R2)]
де F - гіпергеометрична функція .

Raju et al (1997) пояснюють, як різні інші формули, такі як Пратт та Герцберг, "є наближенням до очікуваної гіпергеометричної функції". Наприклад, формула Пратта така

ρ^(П)2=1-(N-3)(1-R2)N-p-1[1+2(1-R2)N-p-2.3]

Як відрізняються оцінки? Доповідь Leach and Hansen (2003) представляє прекрасну таблицю, що показує вплив різних формул на вибірку різних опублікованих наборів даних з психології (див. Таблицю 3). Середній ЄзекіїльRагj2 було .2864 порівняно з Олкіним та Праттом Rагj2 .2917 та Пратт Rагj2.2910. Згідно з початковою цитатою Раджу та ін про різницю між фіксованими та випадковими x формулами, найбільш релевантними для невеликих розмірів вибірки, таблиця Ліча та Хансена показує, як різниця між формулою Езекіїла з фіксованим x та формулою Олкіна та Пратта випадкового x є найбільш помітною в невеликих розмірах зразків, особливо тих, що менше 50.

Список літератури

  • Ліч, Л. Ф. та Хенсон, РК (2003). Використання та вплив скоригованих ефектів R2 у опублікованих регресійних дослідженнях. Під час щорічної зустрічі Південно-Західної асоціації з освітніх досліджень, Сан-Антоніо, Техас. PDF
  • Мітчелл, TW, & Klimoski, RJ (1986). Оцінка обґрунтованості оцінки перехресних дій. Журнал прикладної психології, 71 , 311-317.
  • Педхазур, Е.Й. (1982). Множинна регресія у поведінкових дослідженнях (2-е видання) Нью-Йорка: Холт, Рінехарт та Вінстон.
  • Raju, NS, Bilgic, R., Edwards, JE, & Fleer, PF (1997). Огляд методології: Оцінка обгрунтованості та перехресних дій та використання рівних ваг для прогнозування. Прикладний психологічний вимір, 21 (4), 291-305.
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.