Це питання / тема з'явилася під час обговорення з колегою, і я шукав деякі думки з цього приводу:
Я моделюю деякі дані за допомогою логістичної регресії випадкових ефектів, точніше випадкової логістичної регресії. Для фіксованих ефектів у мене є 9 змінних, які представляють інтерес і враховуються. Я хотів би зробити якийсь вибір моделі, щоб знайти значущі змінні та дати “найкращу” модель (лише основні ефекти).
Моя перша ідея полягала в тому, щоб використовувати AIC для порівняння різних моделей, але з 9 змінними я не надто хвилював порівняння 2 ^ 9 = 512 різних моделей (ключове слово: днопоглинання даних).
Я обговорював це з колегою, і він сказав мені, що пам’ятав, що читав про використання поетапного (або вперед) вибору моделі з GLMM. Але замість використання p-значення (наприклад, на основі тесту на коефіцієнт ймовірності для GLMM), слід використовувати AIC як критерій входу / виходу.
Я вважав цю ідею дуже цікавою, але не знайшов жодних посилань, які б далі обговорювали це, і мій колега не пам’ятав, де він її читав. Багато книг пропонують використовувати AIC для порівняння моделей, але я не знайшов жодної дискусії щодо використання цього методу разом із покроковою чи вперед процедурою вибору моделі.
Тож у мене є два питання:
Чи є щось не так у використанні АПК у процедурі вибору моделі поетапної моделі як критерію входу / виходу? Якщо так, яка б була альтернатива?
Чи є у вас посилання, які обговорюють вищевказану процедуру (також як посилання на підсумковий звіт?
Найкраще,
Емілія