У лінійних регресійних спостереженнях передбачається, що слід розподіл Гаусса із середнім параметром, обумовленим значеннями предиктора. Якщо відняти середнє значення зі спостережень, ви отримаєте помилку : розподіл Гаусса із середнім нулем та незалежний від значень прогноктора - тобто помилки в будь-якому наборі значень прогноктора слідують за тим самим розподілом.
У логістичних регресійних спостереженнях передбачається, що слід розподіл Бернуллі † із середнім параметром (вірогідністю), що обумовлюється значеннями прогноктора. Отже, для будь-яких заданих значень прогноктора, що визначають середнє значення існують лише дві можливі помилки: що виникають з ймовірністю , і що виникають з вірогідністю . Для інших значень предиктора помилки будуть що виникають з ймовірністю , і виникають з вірогідністюπ 1 - π π 0 - π 1 - π 1 - π ′ π ′ 0 - π ′ 1 - π ′у∈ { 0 , 1 }π1 - ππ0 - π1 - π1 - π'π'0 - π'1 - π'. Таким чином, немає загального розподілу помилок, незалежного від значень предиктора, саме тому люди кажуть "немає терміна помилки" (1).
"Термін помилки має біноміальне розподіл" (2) - це просто неохайність - "Гауссові моделі мають гауссові помилки, ерго біноміальні моделі мають біноміальну помилку". (Або, як зазначає @whuber, це може означати "різниця між спостереженням і його очікуванням має біноміальне розподіл, переведене на очікування".)
"Термін помилки має логістичний розподіл" (3) виникає при виведенні логістичної регресії з моделі, де ви спостерігаєте, перевищує чи приховану змінну з помилками після логістичного розподілу деякий поріг. Отже, це не та сама помилка, яка визначена вище. (Здавалося б, дивна річ сказати IMO поза цим контекстом або без явного посилання на приховану змінну.)
† Якщо у вас є спостережень з однаковими значеннями предиктора, що дають однакову ймовірність для кожного, то їх сумаπ ∑ yкπ∑ у слід двочленному розподілу з ймовірністю та ні. випробування k . Враховуючи ∑ y - k π, оскільки помилка призводить до тих же висновків.πк∑ у- k π