У моделях, що не мають термінів взаємодії (тобто без термінів, побудованих як добуток інших термінів), коефіцієнт регресії кожної змінної є нахилом поверхні регресії у напрямку цієї змінної. Він постійний, незалежно від значень змінних, і тому, можна сказати, вимірювати загальний ефект цієї змінної.
У моделях з взаємодіями таке тлумачення можна зробити без додаткової кваліфікації лише для тих змінних, які не задіяні в жодних взаємодіях. Для змінної, яка бере участь у взаємодіях, коефіцієнт регресії головного ефекту - тобто коефіцієнт регресії змінної сам по собі - це нахил поверхні регресії у напрямку до цієї змінної, коли всі інші змінні взаємодіють із цією змінною мають значення нуля , і тест на значимість коефіцієнта відноситься до нахилу поверхні регресії лише в цій області простору прогноктора. Оскільки немає необхідності, щоб насправді існували дані в цій області простору, коефіцієнт основного ефекту може мати незначну схожість з нахилом поверхні регресії в області простору прогноктора, де фактично спостерігалися дані.
По-новому, коефіцієнт основного ефекту є аналогом простого основного ефекту, а не загального основного ефекту. Більше того, воно може посилатися на те, що в дизайні anova були б порожні комірки, в які дані надходили шляхом екстраполяції з комірок даних.
Для вимірювання загального ефекту змінної, яка є аналогом загального основного ефекту в anova і не екстраполює за межі області, в якій спостерігалися дані, ми повинні подивитися на середній нахил поверхні регресії у напрямку змінної , де усереднення перевищує N випадків, які фактично спостерігалися. Цей середній нахил може бути виражений у вигляді зваженої суми коефіцієнтів регресії всіх доданків у моделі, які включають зазначену змінну.
Ваги незручно описати, але їх легко отримати. Коефіцієнт основного ефекту змінної завжди отримує вагу 1. Для кожного іншого коефіцієнта терміна, що включає цю змінну, вага - це середнє значення добутку інших змінних у цьому терміні. Наприклад, якщо у нас є п'ять "сирих" змінних x1, x2, x3, x4, x5
плюс чотири двосторонні взаємодії (x1,x2), (x1,x3), (x2,x3), (x4,x5)
та одна тристороння взаємодія (x1,x2,x3)
, то модель є
y = b0 + b1*x1 + b2*x2 + b3*x3 + b4*x4 + b5*x5 +
b12*x1*x2 + b13*x1*x3 + b23*x2*x3 + b45*x4*x5 +
b123*x1*x2*x3 + e
і загальні основні ефекти є
B1 = b1 + b12*M[x2] + b13*M[x3] + b123*M[x2*x3],
B2 = b2 + b12*M[x1] + b23*M[x3] + b123*M[x1*x3],
B3 = b3 + b13*M[x1] + b23*M[x2] + b123*M[x1*x2],
B4 = b4 + b45*M[x5],
B5 = b5 + b45*M[x4],
де M [.] позначає середнє значення вибірки кількості всередині дужок. Усі терміни продукту всередині дужок належать до тих, які були побудовані для того, щоб зробити регресію, тому програма регресії повинна вже знати про них і мати можливість надрукувати їх засоби за запитом.
У моделях, які мають лише основні ефекти та двосторонні взаємодії, існує більш простий спосіб отримати загальний ефект: зосередити [1] необроблені змінні за допомогою їх засобів. Це потрібно зробити до обчислення умов продукту, а не слід робити з продуктами. Тоді всі вирази M [.] Стануть 0, а коефіцієнти регресії будуть інтерпретуватися як загальні ефекти. Значення B будуть змінюватися; значення B не будуть. Тільки змінні, які беруть участь у взаємодіях, повинні бути центрировані, але зазвичай немає шкоди при центруванні інших вимірюваних змінних. Загальний ефект від центрування змінної полягає в тому, що, крім зміни перехоплення, він змінює лише коефіцієнти інших змінних, які взаємодіють із центрированной змінною. Зокрема, це не змінює коефіцієнтів будь-яких доданків, що передбачають центрированную змінну. У наведеному вище прикладі, центрування x1 змінило б0, b2, b3 і b23.
[1 - "Центрування" використовується різними людьми способами, які досить різняться, щоб викликати плутанину. Як використовується тут, "центрування змінної на #" означає віднімання # від усіх балів змінної, перетворення вихідних балів у відхилення від #.]
То чому б не завжди зосереджуватися на засобах, звичайно? Три причини. По-перше, самі коефіцієнти основного ефекту від безцентризованих змінних можуть представляти інтерес. Центрування в таких випадках було б контрпродуктивним, оскільки воно змінює коефіцієнти основного ефекту інших змінних.
По-друге, центрування зробить усі M [.] Вирази 0 і, таким чином, перетворить прості ефекти в загальні ефекти, лише в моделях, що не мають тристоронніх або вищих взаємодій . Якщо модель містить такі взаємодії, то обчислення b -> B все одно потрібно робити, навіть якщо всі змінні зосереджені за допомогою їх засобів.
По-третє, центрування за таким значенням, як середнє значення, яке визначається розподілом предикторів на відміну від раціонального вибору, означає, що всі коефіцієнти, на які впливає центрування, будуть специфічними для вашої конкретної вибірки. Якщо ви зосереджуєтесь на середньому, то хтось, хто намагається повторити ваше дослідження, повинен зосередитись на вашому середньому, а не на власному рівні, якщо вони хочуть отримати ті самі коефіцієнти, які ви отримали. Рішення цієї проблеми полягає в тому, щоб зосереджувати кожну змінну на раціонально обраному центральному значенні цієї змінної, яке залежить від значення балів і не залежить від розподілу балів. Однак обчислення b -> B все ще залишаються необхідними.
Значимість загальних ефектів може бути перевірена звичайними процедурами тестування лінійних комбінацій коефіцієнтів регресії. Однак результати слід трактувати обережно, оскільки загальний вплив не є структурними параметрами, а залежить від дизайну. Структурні параметри - коефіцієнти регресії (нецентровані або з раціональним центруванням) та відхилення помилок - можуть очікувати, що вони залишаться інваріантними при зміні розподілу предикторів, але загальний ефект, як правило, зміниться. Загальний вплив є специфічним для конкретної вибірки, і не слід очікувати, що вони перенесуться на інші вибірки з різним розподілом на прогнози. Якщо загальний ефект є значним в одному дослідженні, а не в іншому, він може відображати не більше ніж різницю в розподілі прогнозів.