Я б сказав, що індивідуальне число (наприклад, залишкове), яке було результатом випадкового виведення з розподілу ймовірностей, - це реалізоване значення , а не випадкова величина . Так само я б сказав, що безлічN залишки, обчислені за вашими даними та відповідною моделлю e = y -у^, - це набір реалізованих значень. Цей набір чисел може бути вільно концептуалізований як незалежний малюнок від базового розподілуϵ ~ N( мк ,σ2). (На жаль, тут є кілька додаткових складностей. Наприклад, у вас насправді немаєN незалежні відомості, тому що залишки, е, повинен відповідати двом умовам: ∑еi= 0, і ∑хiеi= 0.)
Тепер, враховуючи деякий набір номерів, будь то залишки чи будь-що інше, це, безумовно, правда, що вони мають дисперсію, ∑ (еi-е¯)2/ Н, але це нецікаво. Те, що нас хвилює, - це можливість сказати щось про процес формування даних (наприклад, оцінити дисперсію розподілу населення). Використовуючи попередню формулу, ми могли б дати наближення, замінившиNз залишковими ступенями свободи, але це може бути не гарним наближенням. Це тема, яка може отримати дуже складну ситуацію дуже швидко, але декількома можливими причинами може бути гетеросцедастичність (тобто те, що дисперсія популяції відрізняється на різних рівняхх), А також наявність викидів (тобто, що даний залишковий втягується з іншого населення цілком). Майже напевно, на практиці ви не зможете оцінити дисперсію сукупності, з якої було побудовано чужих людей, але, тим не менш, теоретично це має відмінність. Я підозрюю, що щось у цьому сенсі є авторами, однак я мушу зазначити, що я не читав цієї книги.
Оновлення: Перечитавши питання, я підозрюю, що цитата може посилатися на спосіб "х-значення точки впливає на встановлену регресійну лінію, і, таким чином, на значення залишку, пов'язаного з цією точкою. Ключова ідея, яку можна зрозуміти тут, - це важелі . Я обговорюю ці теми у своїй відповіді тут: Інтерпретація plot.lm () .