Регресія LASSO зменшує коефіцієнти до нуля, забезпечуючи ефективний вибір моделі. Я вважаю, що в моїх даних є змістовні взаємодії між номінальними та безперервними коваріатами. Однак, не обов'язково, що "основні наслідки" справжньої моделі є змістовними (не нульовими). Звичайно, я цього не знаю, оскільки справжня модель невідома. Мої цілі - знайти справжню модель і прогнозувати результат як можна ближче.
Я дізнався, що класичний підхід до побудови моделі завжди включав би головний ефект до включення взаємодії. Таким чином, не може бути моделі без головного ефекту двох коваріатів і якщо в одній моделі взаємодія коваріатівОтже, функція ретельно вибирає умови моделі (наприклад, на основі AIC назад або вперед), дотримуючись цього правила.step
R
LASSO, здається, працює інакше. Оскільки всі параметри штрафуються, може, без сумніву, статися, що основний ефект зменшиться до нуля, тоді як взаємодія найкращої (наприклад, перехресної) моделі не дорівнює нулю. Це я вважаю , зокрема , для моїх даних при використанні R
«s glmnet
пакет.
Я отримав критику на підставі першого правила, процитованого вище, тобто моя остаточна схвалена модель Лассо не включає відповідні умови основного ефекту деяких ненульових взаємодій. Однак це правило видається дещо дивним у цьому контексті. Що зводиться до цього, це питання, чи параметр у справжній моделі дорівнює нулю. Припустимо, це так, але взаємодія не дорівнює нулю, тоді LASSO визначить це, можливо, знайшовши правильну модель. Насправді, здається, що прогнози цієї моделі будуть більш точними, оскільки модель не містить основного ефекту "справжній нуль", який фактично є змінною шуму.
Чи можу я спростувати критику на цій підставі чи я повинен якось попереджувати, що LASSO включає головний ефект перед терміном взаємодії?