Це майже завжди Обман , щоб видалити спостереження для поліпшення регресійній моделі. Вам слід відмовлятися від спостережень лише тоді, коли ви справді думаєте, що це насправді переживачі.
Наприклад, у вас є смарт-годинник, підключений до вашого смарт-годинника. Якщо ви подивитеся на серіал, легко помітити, що були б помилкові спостереження з показаннями на зразок 300 кбіт / с. Їх слід видалити, але не тому, що ви хочете вдосконалити модель (що б це не означало). Вони помилки в читанні, які не мають нічого спільного з вашим серцевим ритмом.
Однак слід бути обережним - співвідношення помилок із даними. У моєму прикладі можна стверджувати, що у вас є помилки, коли монітор серцевого ритму зміщується під час вправ, таких як біг або стрибки. Що зробить ці помилки співвіднесеними зі швидкістю харт. У цьому випадку слід бути обережним у усуненні цих викрадачів та помилок, оскільки вони не є випадковими
Я наведу вам сформульований приклад того, коли не знімати людей, що не впадають у життя . Скажімо, ви вимірюєте рух ваги на пружині. Якщо вага мала відносно сили ваги, то ви помітите, що закон Гука працює дуже добре: де F - сила, k - коефіцієнт напруги і Δ x - позиція ваги .
Ж= - k Δ x ,
ЖкΔ x
Δ x
ОНОВЛЕННЯ У вашому випадку я б запропонував витягнути ці точки даних і ознайомитися з ними ближче. Чи може це бути несправністю лабораторного інструменту? Зовнішнє втручання? Дефект проби? тощо.
Далі спробуйте визначити, чи може співвідношення цих людей, що переживають ці люди, співвідноситься з тим, що ви вимірюєте, як у прикладі, який я дав. Якщо є кореляція, то немає простого способу зробити це. Якщо кореляції немає, ви можете видалити залишків