Для вирішення першого питання розглянемо модель
Y=X+sin(X)+ε
з iid середнього нуля та кінцевої дисперсії. Зі збільшенням діапазону (вважається фіксованим або випадковим) переходить до 1. Тим не менш, якщо дисперсія невелика (приблизно 1 або менше), дані "помітно нелінійні". У сюжетах .εXR2εvar(ε)=1
До речі, простий спосіб отримати малий - це розрізати незалежні змінні у вузькі діапазони. Регресія (використовуючи точно таку ж модель ) у кожному діапазоні буде мати низький навіть коли повна регресія, заснована на всіх даних, має високий . Розмірковування над цією ситуацією - інформаційна вправа та гарна підготовка до другого питання.R2R2R2
Обидва наступні сюжети використовують однакові дані. для повної регресії 0,86. для зрізів (шириною 1/2 від -5/2 до 5/2) є +0,16, +0,18, +0,07, +0,14, +0,08, +0,17, +0,20, +0,12, .01 , .00, читання зліва направо. У будь-якому випадку, пристосування стають кращими в ситуації з нарізаними, оскільки 10 окремих рядків можуть більш точно відповідати даним в їх вузьких межах. Незважаючи на для всіх зрізів значно нижче повного , то ні міцності відносин, в лінійності , ні дійсно , будь-який аспект даних ( за винятком того, діапазон використовується для регресії) змінилися.R2R2R2R2X
(Можна заперечити, що ця процедура нарізки змінює розподіл Це правда, але, тим не менш, вона відповідає найчастішому використанню в моделюванні з фіксованими ефектами і виявляє ступінь, в якій розповідає нам про дисперсія у ситуації випадкових ефектів. Зокрема, коли обмежується змінюватися протягом меншого інтервалу свого природного діапазону, зазвичай падає.)XR2R2XXR2
Основна проблема полягає в тому, що це залежить від занадто багатьох речей (навіть коли вони регулюються в декількох регресіях), але найбільше від дисперсії незалежних змінних та дисперсії залишків. Зазвичай це нічого не говорить про "лінійність" або "міцність відносин", а також про "добру придатність" для порівняння послідовності моделей.R2
Більшу частину часу ви можете знайти кращу статистику, ніж . Для вибору моделі можна звернутись до AIC та BIC; для вираження адекватності моделі подивіться на дисперсію залишків. R2
Це підводить нас нарешті до другого питання . Одна ситуація, в якій може мати деяке використання - це коли незалежні змінні встановлюються на стандартні значення, по суті контролюючи ефект їх дисперсії. Тоді - це дійсно проксі-сервер для дисперсії залишків, відповідно стандартизованих.R21−R2