Я б сказав, що перший, який ви перераховуєте, - це, мабуть, найпоширеніший - і, можливо, найбільш широко вчений таким чином - з речей, які, очевидно, вважаються неправильними, але ось деякі інші, які менш зрозумілі в деяких ситуаціях ( чи дійсно вони застосовуються), але це може вплинути на ще більше аналізів, а можливо, і більш серйозно. Вони часто просто не згадуються при введенні регресу.
Трактування як випадкових вибірок із сукупності, що представляють інтерес, спостережень, які не можуть бути близькими до репрезентативних (не кажучи вже про випадкові вибірки). [Деякі дослідження замість цього можна розглядати як щось наближене до зручності зразків]
Маючи дані спостереження, просто ігноруючи наслідки відмови від важливих драйверів процесу, які, безумовно, зміщують оцінки коефіцієнтів включених змінних (у багатьох випадках навіть, ймовірно, змінюючи їхню ознаку), не намагаючись розглянути способи вирішення з ними (чи то через незнання проблеми, чи просто не знаючи, що щось можна зробити). [У деяких дослідницьких областях ця проблема є більшою мірою, ніж в інших, чи то через тип даних, які збираються, чи тому, що люди в деяких областях застосування, швидше за все, вчили про цю проблему.]
Помилкова регресія (в основному з даними, зібраними з часом). [Навіть коли люди знають, що це трапляється, існує ще одне поширене неправильне уявлення, що достатньо просто розмежування на передбачуване стаціонарне, щоб повністю уникнути проблеми.]
Існує багато інших, про які можна було б згадати, звичайно (наприклад, трактування як незалежних даних, які майже напевно будуть послідовно співвіднесені або навіть інтегровані, може бути настільки ж поширеними, наприклад).
Ви можете помітити, що спостережливі дослідження даних, зібраних з часом, можуть потрапити відразу на все це ... все ж таке дослідження дуже поширене в багатьох областях досліджень, де регресія є стандартним інструментом. Те, як вони можуть потрапити до публікації, коли жоден рецензент чи редактор не знає про принаймні одного з них і, принаймні, вимагає певного рівня відмови у висновках, продовжує мене хвилювати.
Статистика загрожує проблемами невідтворюваних результатів при роботі з досить ретельно контрольованими експериментами (у поєднанні з, можливо, не так ретельно контрольованими аналізами), тож як тільки один крок вийде за ці межі, наскільки гіршою повинна бути ситуація відтворення?