Я буду передмовою цієї відповіді, оскільки я цілком згоден з Гевіном, і якщо вам цікаво підходити до будь-якого типу моделі, вона повинна відображати досліджуване явище. Проблема полягає в логіці виявлення будь-яких ефектів (і на які звертається Гевін, коли він говорить про драгування даних) - це те, що ви можете встановити нескінченну кількість взаємодій, або квадратичні умови для змінних, або перетворення ваших даних, і ви неминуче знайде "значні" ефекти для певних варіацій ваших даних.
Як зазначає chl, ці ефекти взаємодії вищого порядку насправді не мають жодної інтерпретації, і часто навіть взаємодії нижчого порядку не мають жодного сенсу. Якщо ви зацікавлені в розробці причинно-наслідкової моделі, вам слід включити лише ті терміни, на які ви вважаєте, що вони можуть бути доречними для вашої залежної змінної Апріорі, щоб відповідати вашій моделі.
Якщо ви вважаєте, що вони можуть збільшити прогнозовану потужність вашої моделі, вам слід шукати ресурси щодо методів вибору моделі, щоб запобігти надмірному розміщенню вашої моделі.