Я бачив багато місць, де вони мають набори даних вводу / виводу, де спочатку створюють лінійну лінію регресії, виправляють зміщення, а потім використовують лише ці дані для своєї моделі. Я не зрозумів, що таке корекція зміщення?
Я бачив багато місць, де вони мають набори даних вводу / виводу, де спочатку створюють лінійну лінію регресії, виправляють зміщення, а потім використовують лише ці дані для своєї моделі. Я не зрозумів, що таке корекція зміщення?
Відповіді:
Хоча постановка проблеми недостатньо точна, щоб точно знати, про який тип корекції зміщення ви маєте на увазі, я думаю, я можу про це говорити в загальному плані. Іноді оцінювач може бути упередженим. Це просто означає, що, хоча це може бути хорошим оцінкою, його очікуване або середнє значення не точно відповідає параметру. Різниця між середнім оцінкою та істинним значенням параметра називається зміщенням. Коли, як відомо, оцінювач є упередженим, іноді можливо іншими способами оцінити зміщення, а потім змінити оцінювач, віднявши оцінене зміщення від початкової оцінки. Ця процедура називається корекцією зміщення. Це робиться з метою покращення кошторису. Хоча це зменшить упередженість, це також збільшить дисперсію.
Хорошим прикладом успішної корекції зміщення є оцінки корекції зміщення завантажувальної стрічки класифікації помилок класифікації. Оцінка повторної заміни коефіцієнта помилок має великий оптимістичний зміщення, коли розмір вибірки невеликий. Завантажувальний інструмент використовується для оцінки зміщення оцінки замінності, і оскільки оцінка замінності занижує рівень помилки, оцінка зміщення додається до оцінки заміни, щоб отримати коригувану оцінку зміщення завантажувальної похибки. Коли розмір вибірки невеликий 30 або менше, поєднуючи обидва класи в задачі двох класів, деякі форми оцінки завантаження (зокрема, оцінка 632) дають більш точні оцінки показників помилок, ніж перехресне підтвердження виходу з одного виходу (що дуже майже неупереджена оцінка рівня помилок).