У мене є класична лінійна модель, з 5 можливими регресорами. Вони некорельовані між собою і мають досить низьку кореляцію з відповіддю. Я прийшов до моделі, де 3 регресори мають значні коефіцієнти для їх t-статистики (p <0,05). Додавання однієї або обох решти двох змінних дає p значення> 0,05 для статистики t, для доданих змінних. Це змушує мене вірити 3 змінної моделі "найкращою".
Однак, використовуючи команду anova (a, b) в R, де a - це модель 3 змінної, а b - повна модель, значення p для статистики F становить <0,05, що підказує мені віддавати перевагу повній моделі над 3 змінною модель. Як я можу примирити ці явні суперечності?
Спасибі PS Редагувати: Дещо далі. Це домашнє завдання, тому я не буду публікувати деталі, але нам не дано деталей того, що регресори представляють - вони просто пронумеровані від 1 до 5. Нас просять "отримати відповідну модель, даючи обгрунтування".