Чому R повертає NA як коефіцієнт lm ()?


32

Я вписую lm()модель до набору даних, що включає показники за фінансовий квартал (Q1, Q2, Q3, що робить Q4 за замовчуванням). Використовуючи lm(Y~., data = data) Я отримую NAяк коефіцієнт для Q3, і попередження про те, що одна змінна була виключена через особливості.

Чи потрібно додати стовпчик Q4?

Відповіді:


39

NA як коефіцієнт регресії вказує на те, що розглянута змінна лінійно пов'язана з іншими змінними. У вашому випадку це означає, що для деяких a , b , c . Якщо це так, то не існує єдиного рішення для регресії без відкидання однієї зі змінних. Додавання Q 4 лише погіршить питання.Q3=a×Q1+b×Q2+ca,b,cQ4


1
Я згоден ... мабуть, існує проблема з визначеннями фіктивних змінних.
Домінік Комтуа

14
(+1). NA загалом означає, що коефіцієнт не піддається оцінці. Це може статися через точну колінеарність, як ви вже згадували. Але це також може статися через недостатнє спостереження для оцінки відповідних параметрів (наприклад, якщо ). Якщо ви прогнозувачі категоричні і додаєте терміни взаємодії, НС також може означати, що немає спостережень за цією комбінацією рівнів факторів. p>n
Макрос

2
p>n

Змінні не є лінійно пов'язаними, оскільки Q3 = 1 iff Q1 = Q2 = 0. Більше того, використання stepAIC () та змушення моделі включати всі три змінні не викликає проблем. Крім того, у мене приблизно 3 рази кількість спостережень до змінних. Моя найкраща здогадка полягає в тому, що між Q3 та деякою іншою змінною є узгодженість, яка, напевно, є такою, яка не включена в stepAIC.
Fraijo
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.