Відповідні залишкові ступені свободи після випадання умов з моделі


27

Я розмірковую над дискусією навколо цього питання і, зокрема, зауваженням Френка Харрелла про те, що для оцінки дисперсії у зменшеній моделі (тобто такої, з якої було випробувано та відхилено ряд пояснювальних змінних), слід використовувати Узагальнені ступені свободи . Професор Гаррелл зазначає, що це буде набагато ближче до залишкових ступенів свободи вихідної "повної" моделі (з усіма змінними), ніж до кінцевої моделі (від якої було відхилено ряд змінних).

Питання 1. Якщо я хочу застосувати відповідний підхід до всіх стандартних зведених даних та статистичних даних за скороченою моделлю (але не повним впровадженням Узагальнених ступенів свободи), розумним підходом буде просто використання залишкових ступенів свободи від повна модель в моїх оцінках залишкової дисперсії тощо?

Питання 2. Якщо вищезазначене вірно і я хочу це зробити R, можливо, це буде так само просто, як налаштування

finalModel$df.residual <- fullModel$df.residual

в якийсь момент вправи на встановлення моделі, де finalModel і fullModel були створені з lm () або подібною функцією. Після чого такі функції, як sumar () та conint (), здається, працюють з потрібним df.residual, хоча і повертають повідомлення про помилку, яке хтось чітко вимкнув навколо об'єкта finalModel.


8
Гарне питання. Це пов’язано з тим, чому Дуглас Бейтс не включає значення р у lmerвиводі. Дивіться його міркування тут .

2
Я не раз бачив повну модель df, що використовується в такій ситуації. (Підхід Ye виникає багато в різних ситуаціях; я вважаю, що це документ, який я рекомендую людям регулярно. Було б непогано мати якусь загальну, але ефективну R функцію, якою можуть скористатися багато функцій.)
Glen_b -Встановити Моніку

Відповіді:


3

Чи не погоджуєтесь ви з відповіддю @ FrankHarrel про те, що паршість все-таки є деякими потворними науковими компромісами?

Мені подобається посилання, надане у коментарі @ MikeWiezbicki до обгрунтування Дуга Бейтса. Якщо хтось не погоджується з вашим аналізом, він може зробити це по-своєму, і це цікавий спосіб розпочати наукове обговорення ваших базових припущень. Значення р не робить ваш висновок «абсолютною істиною».

Якщо рішення про включення параметра чи ні у вашу модель зводиться до "підбору волосків" щодо того, що є для науково значимих зразків порівняно невеликими розбіжностями у df - і ви не маєте справу з проблемами, які виправдовують все-таки більш нюансований висновок - тоді у вас є парам настільки близький до зустрічі зі своїми відсіченнями, що ви повинні бути прозорими і говорити про це будь-яким способом: просто включіть його або проаналізуйте модель з і без неї, але обов'язково прозоро обговоріть своє рішення в остаточний аналіз. n<p


2
+1, і я зараз схильний погодитись, що насправді моє первісне питання не так важливо, враховуючи ці інші питання
Пітер Елліс
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.