Взаємодії потрібні чітко в регресійних моделях, оскільки формула сама по собі не включає ніяких взаємодій. Точніше, регресійна модель завжди буде лінійною у своєму введенні, тоді як взаємодія - це нелінійна комбінація ознак.Xi∗Xj
Найпростіший спосіб це побачити через XOR-задачу, регресійна модель без будь-яких взаємодій не може це вирішити, оскільки це вимагає нелінійної комбінації.
KNN та SVM з іншого боку (і багато інших моделей також) є універсальними функціональними приладами. Це означає, що вони не можуть поєднувати свої вклади лише лінійним способом, але й будь-яким можливим нелінійним способом. Якщо дано достатню кількість шарів або підходяще ядро, вони в основному можуть "створити" власну взаємодію саме так, як їм потрібно. Якщо ви знаєте чи очікуєте, що конкретні взаємодії будуть важливими, ви все одно можете використовувати їх як вхід, щоб направити моделі в правильному напрямку.
Аналогічно, моделі на основі дерев можна трактувати лише як взаємодію. В основному, розкол в деревній моделі створює специфічну взаємодію з усіма попередніми змінними.
Тож для вирішення, які взаємодії використовувати, для моделей з достатньою потужністю (тобто таких, які є універсальними аплікаторами функцій), вони вам не потрібні, і ви можете дозволити моделі робити власну магію. Для інших моделей це залежить. Існують деякі методи, які керують рішенням, наприклад, CHAID або поетапна регресія. CHAID також працює з великою кількістю функцій, для поступової регресії він може загубитися в кількості можливих взаємодій. З огляду на те, що якщо у вас функцій, можливі можливих взаємодій (рахуючи не лише двосторонні, але й взаємодії вищого порядку).2 NN2N