Яка різниця між помилками та залишками?


20

Хоча ці два всюдисущі терміни часто вживаються синонімічно, іноді, здається, існує відмінність. Чи справді є різниця, чи вони точно синонімічні?


Ознайомтесь із Ціном та Гілбертом "Термін помилок в історії економетрії часових рядів" на комплексне лікування, якщо у вас є час. О, але це лише для даних часових рядів.
Річард Харді

Відповіді:


20

Помилки стосуються справжнього процесу генерації даних (DGP), тоді як залишки - це те, що залишилося після оцінки вашої моделі. По правді кажучи, такі припущення, як нормальність, гомоседастичність та незалежність, стосуються помилок DGP, а не залишків вашої моделі. (Наприклад, маючи відповідніпараметри у вашій моделі, лише N - ( p + 1 ) залишки можуть бути незалежними.) Однак ми маємо доступ лише до залишків, тому з цим ми працюємо. p+1N(p+1)


9
(+1) Залишки можна вважати оцінками помилок.
Scortchi

@ABC, DGPозначає процес генерації даних . Навіть якщо ваша модель відповідна та відображає справжню структуру DGP, залишки не обов'язково будуть нормальними, гомосептичними та незалежними, якщо основні помилки не були.
gung - Відновіть Моніку

@Scortchi Привіт! Чи трапляється у вас які-небудь посилання на ваш коментар? Я намагаюся зрозуміти, чому саме залишки можуть бути використані як оцінки помилки, тому що я бачу людей, які перевіряють нормальність залишків в регресійному аналізі, коли фактичне припущення - це нормальність помилки, і не знаю точно, чому це справедливо.
Остін

@Austin, якщо ти все ще зацікавився цим, то слід задати нове запитання.
gung - Відновіть Моніку

13

Помилка різниця між спостережуваним значенням і істинним значенням (дуже часто непомітно, породженого ДГП).

Залишкова різниця між спостережуваним значенням і прогнозованим значенням (за моделлю).


±

Це посилання ( ece.rochester.edu/courses/ECE111/error_ucurityty.pdf ) дає хороше пояснення з посиланнями на тексти Бевінгтона та Тейлора з цього приводу.
Стівен К. Хоуелл

Чи є у машинному мові навчання помилкою навчання та помилкою є помилка тесту?
Чарльз Чоу

@CharlesChow Це залежить від того, який набір даних ви використовуєте. Якщо ви використовуєте навчальний набір, то це помилка тренувань; якщо ви використовуєте тестовий набір, то це помилка тесту.
Леопольд В.

7

Термін помилки - це теоретичне поняття, яке ніколи не можна спостерігати, але залишкове значення - це реальна світова величина, яка обчислюється для кожного разу, коли здійснюється регресія.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.