Припущення про нормальність при лінійній регресії


11

Як припущення про лінійну регресію, нормальність розподілу помилки іноді помилково "розширюється" або трактується як потреба в нормальності y або x.

Чи можливо побудувати сценарій / набір даних, що там, де X і Y ненормальні, але термін помилки є, і тому отримані оцінки лінійної регресії є дійсними?


5
Тривіальний приклад: X має розподіл Бернуллі (тобто, приймаючи значення 0 або 1); Y = X + N (0, 0,1). Ні X, ні Y зазвичай не розподіляються самостійно, але регресування Y на X все ще працює.
Гонг-Ой

Я думаю, ви думаєте про розподіл залишків, а не про розподіл змінних.
tashuhka


Відповіді:


16

Розширення на коментар Hong Oois із зображенням. Ось зображення набору даних, де жодне з маргіналів зазвичай не розподіляється, але залишки все ще є, тому припущення про лінійну регресію все ще дійсні:

введіть тут опис зображення

Зображення генерувалося за допомогою наступного коду R:

library(psych)
x <- rbinom(100, 1, 0.3)
y <- rnorm(length(x), 5 + x * 5, 1)

scatter.hist(x, y, correl=F, density=F, ellipse=F, xlab="x", ylab="y")
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.