Часто статистичному аналітику вручають встановлений набір даних і запитують підходити до моделі за допомогою такої методики, як лінійна регресія. Дуже часто набір даних супроводжується відмовою від відповідальності, подібною до "О так, ми заплуталися, збираючи деякі з цих точок даних - робіть все, що можете".
Така ситуація призводить до регресійних припадків, які сильно впливають на наявність аутлайнерів, які можуть бути помилковими даними. З огляду на наступне:
Небезпечно, як з наукової, так і з моральної точки зору, викидати дані без будь-якої іншої причини, ніж це "робить пристосування виглядати погано".
У реальному житті людям, які зібрали дані, часто не вдається відповісти на запитання типу "при створенні цього набору даних, який із пунктів ви точно зіпсували?"
Які статистичні тести чи правила можуть бути використані в якості основи для виключення випускників у лінійному регресійному аналізі?
Чи є якісь особливі міркування щодо багатолінійної регресії?