Щоб трохи розширити відповідь @ ken-butler. Додаючи як безперервну змінну (години), так і індикаторну змінну для спеціального значення (годин = 0, або не годування груддю), ви вважаєте, що існує лінійний ефект для "не спеціального" значення і дискретний стрибок у передбачуваний результат за особливою цінністю. Це допомагає (принаймні для мене) подивитися графік. У наведеному нижче прикладі ми моделюємо погодинну заробітну плату як функцію годин на тиждень, що працюють респонденти (усі жінки), і ми вважаємо, що у "стандартних" 40 годин на тиждень є щось особливе:
Код, який створив цей графік (у статистиці), можна знайти тут: http://www.stata.com/statalist/archive/2013-03/msg00088.html
Тож у цьому випадку ми призначили безперервній змінній значення 40, хоча ми хотіли, щоб вона трактувалась інакше, ніж інші значення. Аналогічно, ви б на тиждень годували грудьми значення 0, навіть якщо ви думаєте, що воно якісно відрізняється від інших значень. Я тлумачу ваш коментар нижче, що ви вважаєте, що це проблема. Це не так, і вам не потрібно додавати термін взаємодії. Насправді цей термін взаємодії буде відмінений через досконалу колінеарність, якщо ви спробували. Це не обмеження, воно просто говорить про те, що умови взаємодії не додають нової інформації.
Скажіть, ваше рівняння регресії виглядає так:
y^=β1weeks_breastfeeding+β2non_breastfeeding+⋯
Де є число тижнів грудного вигодовування ( в тому числі значення 0 для тих , які не годують грудьми) і п про п _ Ь т е и т е e e d i n g - показник змінної, який дорівнює 1, коли хтось не годує грудьми, а 0 в іншому випадку.weeks_breastfeedingnon_breastfeeding
Поміркуйте, що відбувається, коли хтось годує грудьми. Рівняння регресії спрощує:
y^=β1weeks_breastfeeding+β20+⋯=β1weeks_breastfeeding+⋯
Таким чином, - це лише лінійний ефект від кількості тижнів годування груддю для тих, хто годує груддю.β1
Поміркуйте, що відбувається, коли хтось не годує грудьми:
y^=β10+β21+⋯=β2+⋯
Отже, дає ефект не годування груддю, а кількість тижнів годування груддю випадає з рівняння.β2
Ви можете бачити, що не потрібно використовувати додавання терміна взаємодії, оскільки цей термін взаємодії вже є (неявно).
Однак у є щось дивне , оскільки він вимірює ефект від грудного вигодовування, порівнюючи очікуваний результат тих, хто не годує груддю, з тими, хто годує грудьми, але робить це лише за 0 тижнів ... Це має сенс у "порівнянні" як, наприклад "подібним чином", але практична корисність не є очевидною. Можливо, буде більше сенсу порівнювати «не годуючих дітей грудьми» з тими жінками, які годували грудьми 12 тижнів (приблизно 3 місяці). У такому випадку ви просто даєте "не годуючим груддю" значення 12 для w e e k s _ b r e a s t f e e d i n gβ2weeks_breastfeeding. Отже, значення, яке ви присвоюєте для "не годуючих дітей грудьми", впливає на коефіцієнт регресії β 2 в тому сенсі, що визначає, з ким "не -груднички »порівнюються. Замість проблеми це насправді щось, що може бути досить корисним.weeks_breastfeedingβ2