Це не проблема, характерна для R. R використовує звичайне відображення коефіцієнтів.
Коли ви читаєте такі результати регресії (в папері, підручнику чи зі статистичного програмного забезпечення), вам потрібно знати, які змінні є "безперервними", а які "категоричними":
"Безперервні" є явно числовими, і їх числові значення використовувались як є в регресійному примірнику.
"Категоричні" змінні можуть бути будь-якого типу, включаючи числові! Те, що робить їх категоричними, полягає в тому, що програмне забезпечення розглядало їх як "фактори": тобто кожне окреме значення, яке знайдено, вважається показником чогось виразного.
Більшість програмного забезпечення розглядатиме нечислові значення (наприклад, рядки) як фактори. Більшість програмного забезпечення може бути переконана трактувати числові значення як фактори. Наприклад, код поштової служби (Поштовий індекс у США) виглядає як номер, але насправді є лише кодом для набору поштових скриньок; не було б сенсу додавати, віднімати та множувати поштові індекси на інші числа! (Ця гнучкість є джерелом поширеної помилки: якщо ви не будьте обережні чи мимовільні, ваше програмне забезпечення може ставитися до змінної, яку ви вважаєте категоричною як безперервну, або навпаки. Будьте уважні!)
Тим не менш, категоричні змінні повинні бути певним чином представлені як числа, щоб застосувати відповідні алгоритми. Існує багато способів їх кодування . Коди створюються за допомогою "фіктивних змінних". Дізнайтеся більше про фіксовану змінну кодування за допомогою пошуку на цьому сайті; деталі тут не мають значення.
У питанні нам сказано, що це h
і f
категоричні ("дискретні") значення. За замовчуванням, log(d)
і a
безперервні. Це все, що нам потрібно знати. Модель є
у= - 0,679695+ 1,7791294 журнал ( д)+ 0,870735- 0,447570+ 0,542033+ 0,037362 а - 0,588362+ 0,816825+ 0,534440- 0,085658 а- 0,034970 а- 0,040637 а якщо h =год1 якщо h =год2 якщо h =год3 якщо f=f1 якщо f=f2 якщо f=f3 якщо h=год1 якщо h=год2 якщо h=год3
Тут застосовуються правила:
Термін "перехоплення", якщо він з'явиться, є адитивною константою (перший рядок).
Безперервні змінні множаться на коефіцієнти, навіть в «взаємодіях» подібно h1:a
, h2:a
і h3:a
терміни. (Це відповідає на початкове запитання.)
Будь-яка категорична змінна (або коефіцієнт) включається лише у випадках, коли відображається значення цього коефіцієнта.
Наприклад, припустимо, що , , і . Встановлене значення в цій моделі становитьжурнал(д) = 2h =год3a = - 1f=f2
у^= - 0,6797 + 1,77913 × ( 2 ) + 0,5420 + 0,0374 × ( - 1 ) + 0,8168 - 0,0406 × ( - 1 ) .
Зверніть увагу , як більшість з коефіцієнтів моделі просто не з'являється в розрахунку, тому що h
може взяти на себе рівно одне з трьох значень , , і , отже , тільки один з трьох коефіцієнтів відносяться і тільки один із трьох коефіцієнтів при взаємодії помножиться ; аналогічно, у будь-якому конкретному випадку застосовується лише один коефіцієнт .год1год2h3(0.870735,−0.447570,0.542033)h
(−0.085658,−0.034970,−0.040637)a
h:a
f
g1