Схоже, ви використовуєте R
. Якщо це так, зверніть увагу , що ви можете визначити точки на діаграмі розсіювання з використанням ? Ідентифікувати . Я думаю, що тут відбувається кілька речей. По-перше, у вас дуже впливовий момент на сюжеті LN_RT_vol_in ~ LN_AT_vol_in
(виділеного) приблизно в (.2, 1.5). Це, швидше за все, стандартизований залишок, який становить приблизно -3,7. Ефектом цієї точки буде вирівнювання лінії регресії, нахиливши її більш горизонтально, ніж різко вгору лінія, яку ви в іншому випадку отримали б. Ефект цього полягає в тому, що всі ваші залишки будуть повернуті проти годинникової стрілки щодо місця, де вони б інакше були розташовані в межах residual ~ predicted
ділянки (принаймні, якщо думати з точки зору цього коваріату та ігнорувати інший).
Тим не менше, очевидна пряма лінія залишків, яку ви бачите, все ще буде там, оскільки вони існують десь у тривимірній хмарі ваших вихідних даних. Їх, можливо, важко знайти в будь-якому з граничних сюжетів. Ви можете використовувати функцію identi () для допомоги, а також можете використовувати пакет rgl для створення динамічного 3D-розсіювача, який можна вільно обертати за допомогою миші. Однак зауважте, що прямі залишки прямолінійних значень нижче 0 у передбачуваному значенні та мають нижче 0 залишків (тобто вони нижче встановленої регресійної лінії); це дає велику підказку щодо того, де шукати. Подивившись знову на свою ділянкуLN_RT_vol_in ~ LN_AT_vol_in
, Я думаю, я можу їх побачити. Нижній край хмари точок у цьому регіоні є досить прямим скупченням точок, що ведуть по діагоналі вниз та зліва приблизно від (-.01, -1.00). Я підозрюю, що це питання.
Іншими словами, залишки виглядають саме так, оскільки вони є таким чином десь у просторі даних. По суті, це пропонує @ttnphns, але я не думаю, що це абсолютно константа в будь-якому з вихідних розмірів - це константа в розмірності під кутом до первісних осей. Я також погоджуюся з @MichaelChernick, що ця очевидна прямота в залишковому сюжеті, ймовірно, нешкідлива, але що ваші дані насправді не дуже нормальні. Однак вони є дещо нормальними, і, здається, у вас є пристойна кількість даних, тому CLT може охопити вас, але ви, можливо, захочете завантажитися на будь-який випадок. Нарешті, я б потурбувався, що цей "чужий" рухає ваші результати; надійний підхід , ймовірно , заслуговує.