Відповідь - ні , оскільки зміщення та дисперсія - це атрибути параметрів моделі, а не дані, що використовуються для їх оцінки. Є часткове виняток із цього твердження, яке стосується зміщення та різниці (га!) Через прогностичний простір; докладніше про це нижче. Зауважте, що це абсолютно не має нічого спільного з знанням деякої "справжньої" функції, що стосується прогнозів та змінних відповідей.
Розглянемо оцінку β в лінійній регресії, β^= (ХТХ)- 1ХТY, де Х є N× P матриця предикторів, β^ є П× 1 вектор оцінок параметрів та Y є N× 1вектор відповідей. Припустимо задля аргументу, що у нас є нескінченна сукупність даних, з яких можна черпати (до речі, це не зовсім смішно - якщо ми активно записували дані з якогось фізичного процесу, ми могли б швидко записувати дані прогнозування та відповіді. , таким чином практично задовольняючи це припущення). Тож ми малюємоN спостереження, кожне з яких складається з одного значення відповіді та значення для кожного з них Ппровісники Потім ми обчислюємо нашу оцінкуβ^і записувати значення. Давайте тоді візьмемо весь цей процес і повторимо йогоNя т е р разів, щоразу роблячи Nнезалежні розіграші від населення. Ми накопичимоNя т е р кошторисів β^над яким ми можемо обчислити дисперсію кожного елемента у векторі параметрів. Зауважимо, що дисперсія оцінок цих параметрів обернено пропорційнаN і пропорційний П, припускаючи ортогональність предикторів.
Зміщення кожного параметра можна оцінити аналогічно. Хоча ми можемо не мати доступу до "справжньої" функції, припустимо, ми можемо зробити довільно велику кількість нічиїх для населення, щоб обчислитиβ^б е с т, який буде виконувати функцію проксі-сервера для значення "true". Будемо вважати, що це неупереджена оцінка (звичайні найменші квадрати) і що кількість використаних спостережень була достатньо великою, щоб відхилення цієї оцінки було незначним. Для кожного зП параметри, ми обчислюємо β^б е стj-β^j, де j варіюється від 1 до Nя т е р. Середнє значення цих різниць приймаємо за оцінку зміщення у відповідному параметрі.
Існують відповідні способи пов’язання зміщення та відмінності з самими даними, але вони трохи складніші. Як бачите, зміщення та дисперсію можна оцінити для лінійних моделей, але вам знадобиться зовсім небагато даних про затримку. Більш підступною проблемою є той факт, що як тільки ви почнете працювати з фіксованим набором даних, ваші аналізи будуть забруднені вашою особистою дисперсією, оскільки ви вже почали блукати по саду розгалужуючих шляхів, і немає ніякого способу знати, як це буде повторюватись поза вибіркою (якщо тільки ви не придумали єдину модель і не запустили цей аналіз і погодилися залишити його в спокої після цього).
Що стосується питання самих точок даних, то найбільш правильна (і тривіальна) відповідь полягає в тому, що якщо є якась різниця між Y і Y^, вам потрібна більш складна модель (якщо припустити, що ви могли правильно визначити всі відповідні прогнози; ви не можете). Не вдаючись до нудного трактату про філософський характер "помилки", суть полягає в тому, що щось сталося, що змусило вашу модель пропустити свій слід. Проблема полягає в тому, що додавання складності збільшує дисперсію, що, ймовірно, призведе до пропуску позначки в інших точках даних. Отже, турбуватися про віднесення помилок на рівні окремих точок даних, ймовірно, не буде плідною справою. Виняток (згаданий у першому абзаці) випливає з того, що зміщення та дисперсія - це фактично функції самих передбачувачів, тому у вас може бути велике зміщення в одній частині простору передбачувача та менші зміщення в іншій (те саме для варіації). Ви можете оцінити це шляхом обчисленняY-Y^ багато разів (де Y^= Xβ^ і β^ не оцінювались на основі Y) та побудова графіку його зміщення (середнього) та дисперсії як функції значень Х. Однак я думаю, що це досить спеціалізоване питання.