Спостерігається лівий косий та симетричний розподіл


10

Це мені досить важко описати, але я спробую зробити свою проблему зрозумілою. Тому спочатку ви повинні знати, що я до цього часу робив дуже просту лінійну регресію. Перш ніж оцінити коефіцієнт, я спостерігав за розподілом свого . Це важкий лівий косий. Після того, як я оцінив модель, я повністю впевнено спостерігав залишкову косий залишок на QQ-Plot, але я абсолютно цього не робив. Що може бути причиною цього рішення? Де помилка? Або розподіл не має нічого спільного з розподілом терміна помилки?уу


@Aniko дає гарну відповідь у відповідь на ваше попереднє запитання.
whuber

Відповіді:


22

Щоб відповісти на ваше запитання, візьмемо дуже простий приклад. Проста модель регресії задається , де . Тепер припустимо, що є дихотомічним. Якщо не дорівнює нулю, то розподіл буде не нормальним, а насправді є сумішшю двох нормальних розподілів, одного із середнім та одного із середнім .уi=β0+β1хi+ϵiϵiN(0,σ2)хiβ1уiβ0β0+β1

Якщо досить великий і досить малий, то гістограма буде виглядати бімодальною. Однак також можна отримати гістограму що виглядає як "єдиний" косий розподіл. Ось один приклад (з використанням R):β1σ2уiуi

xi <- rbinom(10000, 1, .2)
yi <- 0 + 3 * xi + rnorm(10000, .7)
hist(yi, breaks=20)
qqnorm(yi); qqline(yi)

Це не розподіл , а розподіл термінів помилки.уi

res <- lm(yi ~ xi)
hist(resid(res), breaks=20)
qqnorm(resid(res)); qqline(resid(res))

І це виглядає цілком нормально - не тільки образно кажучи =)


"але розподіл термінів помилки" Ви маєте на увазі тут залишки, а не помилки, правда? Більше про залишки проти помилки: stats.stackexchange.com/questions/133389/…
vasili111

7

Посилаючись на відмінну відповідь від @Wolfgang, ось сюжети з його коду R:

введіть тут опис зображення

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.