Q: "... як я інтерпретую значення x2" Високе "? Наприклад, який вплив мають" Високі "х2 на змінну відповідей у наведеному тут прикладі ??
Відповідь: Ви, без сумніву, помітили, що x2 = "High" у виході не згадується. На даний момент x2High обраний як "базовий випадок". Це тому, що ви запропонували факторну змінну з кодуванням за замовчуванням для рівнів, незважаючи на впорядкованість, яка була б більш природною для людського розуму. Але "H" лексично перед алфавітом "L" і "M" було вибрано R як основний регістр.
Оскільки "x2" не було впорядковано, кожен із повідомлених контрастів був відносно x2 = "High" і тому x2 == "Low" оцінювали у -0,78 щодо x2 = "High". На даний момент перехоплення - це орієнтовне значення "Y", коли x2 = "High" і x1 = 0. Ви, ймовірно, хочете повторно запустити свою регресію після зміни порядку впорядкування (але не впорядковуючи коефіцієнт).
x2a = factor(x2, levels=c("Low", "Medium", "High"))
Тоді ваша оцінка "Середня" та "Висока" буде більше відповідати тому, що ви очікуєте.
Редагувати: Існують альтернативні схеми кодування (або точніше розташування матриці моделі.) Вибір за замовчуванням для контрастів у R - це "контрасти лікування", який визначає один рівень фактора (або одну конкретну комбінацію рівнів факторів) як еталонний рівень та звіти оцінені середні відмінності для інших рівнів або комбінацій. Тим не менш, рівень опорного рівня може бути загальним середнім, примушуючи Intercept до 0 (не рекомендується) або використовуючи один з інших варіантів контрасту:
?contrasts
?C # which also means you should _not_ use either "c" or "C" as variable names.
Можна вибирати різні контрасти для різних факторів, хоча це, мабуть, накладає додатковий тягар для інтерпретації. S-Plus використовує контрасти Гельмерта за замовчуванням, а SAS використовує контрасти лікування, але вибирає останній рівень фактора, а не перший в якості еталонного рівня.