Перш ніж вирішувати це, важливо визнати, що статистична помилка "усунення інших людей" була помилково розповсюджена у більшості застосованої статистичної педагогіки. Традиційно люди, що переживають люди, визначають як високі важелі, спостереження з високим впливом. Можна і слід ідентифікувати такі спостереження при аналізі даних, але ці умови самі по собі не є підставою для видалення цих спостережень. "Справжній перешкод" - це спостереження з високим важелем / високим впливом, що не відповідає тиражам експериментальної конструкції. Щоб вважати спостереження таким, потрібне спеціалізоване знання цієї сукупності та науки, що стоїть за "механізмом генерування даних". Найважливіший аспект полягає в тому, що ви повинні мати можливість виявляти потенційних людей, які вижили в минулому .
Що стосується аспекту завантаження речей, завантажувальний пристрій призначений для імітації незалежних, повторних малюнків із сукупності вибірки. Якщо ви конкретизуєте критерії виключення у своєму плані аналізу, ви все одно повинні залишати виключені значення у розподілі вибіркового завантаження референтних даних . Це пояснюється тим, що ви будете обліковувати втрату живлення через застосування виключень після вибірки даних. Однак, якщо немає попередньо визначених критеріїв виключення, і вилучення видаляються за допомогою постсоціального рішення, як я, очевидно, проти цього, протистояння цим значенням буде поширювати ті самі помилки у висновках, які викликані видаленням залишків.
Розглянемо дослідження про багатство та щастя в необгрунтованому простому випадковому зразку з 100 осіб. Якби ми взяли твердження, що "1% населення утримує 90% світового багатства" буквально, то ми б спостерігали, в середньому, одне дуже впливове значення. Припустимо, що, крім забезпечення базової якості життя, не було надлишкового щастя, що пояснюється більшими доходами (нестабільна лінійна тенденція). Таким чином, ця особа також є високим важелем.
Коефіцієнт регресії найменших квадратів відповідає вмісту даних, що не містять даних, за середніми тенденціями першого порядку в цих даних. Він сильно ослаблений нашою 1 особою у вибірці, щастя якої відповідає рівню, що знаходиться поблизу середнього рівня доходу. Якщо ми видалимо цю особу, то нахил регресії найменших квадратів значно більший, але дисперсія регресора зменшена, отже, висновок про асоціацію приблизно однаковий. Складність з цим полягає в тому, що я не уточнив умови, в яких люди будуть виключені. Якщо інший дослідник повторив цю конструкцію дослідження, він відібрав би в середньому одного високого доходу, помірно щасливого індивіда, і отримав результати, що не відповідали моїм "підстриженим" результатам.
Якби ми були апріорно зацікавлені в помірному щастя доходу асоціації, то ми повинні були вказаним , що ми б, наприклад , «порівнювати фізичні особа , які отримують менше , ніж $ 100,000 річного дохід домогосподарства». Таким чином, видалення зовнішньої форми змушує нас оцінити асоціацію, яку ми не можемо описати, отже, значення p не мають сенсу.
З іншого боку, неправильно відкаліброване медичне обладнання та ретельне неправдиве опитування брехні можуть бути усунені. Чим точніше, що критерії виключення можна описати до того, як відбудеться фактичний аналіз, тим більш обґрунтованими та послідовними будуть результати, які дасть такий аналіз.