tl; dr - для регресії OLS, чи має вищий R-квадрат також вищу величину P? Зокрема для однієї пояснювальної змінної (Y = a + bX + e), але також було б цікаво знати декілька n пояснювальних змінних (Y = a + b1X + ... bnX + e).
Контекст - я виконую регресію OLS на діапазоні змінних і намагаюся розробити найкращу пояснювальну функціональну форму, створивши таблицю, що містить значення R-квадрата між лінійною, логарифмічною тощо, перетвореннями кожної пояснювальної (незалежної) змінної і змінна відповідь (залежна). Це виглядає приблизно так:
Назва змінної - лінійна форма-- - ln (змінна) --exp (змінна) - ... тощо
Змінна 1 ------- R-квадрат ---- ---- R-квадрат ---- R-квадрат -
... і т.д. ...
Мені цікаво, чи R-квадрат підходить, чи значення Р було б краще. Імовірно, є певні відносини, оскільки більш значущі відносини означатимуть більшу пояснювальну силу, але не впевнені, чи це правда суворо.