Як використовувати anova для порівняння двох моделей?


9

Як слід зрозуміти anovaрезультат при порівнянні двох моделей?

Приклад:

  Res.Df    RSS Df Sum of Sq      F    Pr(>F)    
1      9 54.032                                  
2      7  4.632  2      49.4 37.329 0.0001844 ***

На сторінці сторінки зазначено: "Обчислити аналіз дисперсійних (або відхильних) таблиць для одного або декількох пристосованих об'єктів моделі." Однак професор зазначив, що це може бути використано для порівняння моделей - ось що я маю намір зробити.

Отже, я припускаю, що я міг би використати anova(model1, model2)і отримати p-значення, яке підказує мені, чи варто відкидати нульову гіпотезу: "моделі однакові".

Чи можу я зазначити, що якщо значення p менше, ніж (скажімо) 0,05, моделі значно відрізняються?


У вашому прикладі вкладені модель1 та model2? Тобто, чи мають обидві моделі спільний набір змінних прогнозів та однакову змінну результатів, але одна модель має одну чи більше додаткових змінних прогнозів?
EdM

Один схожий, Y ~ X + X^2а другийY ~ X + X^2 + X^3
петрбель

Відповіді:


13

Якщо припустити, що ваші моделі є вкладеними (тобто однакова змінна результат і модель 2 містить усі змінні моделі 1 плюс 2 додаткові змінні), то результати ANOVA зазначають, що дві додаткові змінні спільно мають достатню дисперсію, що ви можете відкинути нульову гіпотезу, що коефіцієнти для обох змінних рівні 0. Це ефективно те, що ви сказали. Якщо обидва коефіцієнта рівні 0, то моделі однакові.

Як додаткова примітка, якщо ви цього не знали, ANOVA завжди еквівалентний порівнянню моделей. Якщо ви дивитесь на ANOVA для однієї моделі, вона дає вам ефекти для кожної змінної прогнозувача. Це еквівалентно порівнянню моделі між повною моделлю та моделлю, що видаляє одну із змінних. тобто дасть вам суму квадратів (тип III) та тестову статистику для . Тільки зауважте, що R дає вам тип I суми квадратів. Якщо вам потрібен тип III, використовуйте або використовуйте та продовжуйте змінювати порядок змінних у моделі та візьміть лише суму квадратів для останньої змінної.Model1:y=a+bx1+cx2+dx3;Model2:y=a+bx1+cx2x3car::Anovaanova


Якщо я вас правильно зрозумів, значення р менше 0,05 доводить, що моделі відрізняються, тісні?
petrbel

3
Я б не використовував ці слова (тобто "довести" та "моделі відрізняються"), але ми маємо на увазі те саме. Я б сказав, що ваші дані не підтримують нульову гіпотезу про те, що коефіцієнти обидва є 0 або що дані підтримують альтернативну гіпотезу, що коефіцієнти не є обома 0.
le_andrew

1
Перш ніж висловити твердження, що моделі довели, що різні або що нулева гіпотеза не підтримується, переконайтеся, що дані обгрунтовано відповідають припущенням ANOVA, що лежать в основі обчислення та інтерпретації p-значень.
EdM

Щоб переконатися, остання частина про суму I квадратів типу I стосується лише ситуації, коли anova()використовується на одній моделі?
Джаспер
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.