Що є більш точним glm чи glmnet?


10

R glm і glmnet використовують різні алгоритми.

Я помічаю нетривіальні відмінності між оціненими коефіцієнтами, коли використовую обидва.

Мене цікавить, коли один є більш точним, ніж інший, і час вирішити / точність торгувати.

Зокрема, я маю на увазі випадок, коли в glmnet st встановлюється лямбда = 0, він оцінює те саме, що і glm.


1
Ви запитуєте про відмінності в продуктивності та точності, коли лямбда = 0, де два теоретично повинні бути однаковими. Я думаю, ви повинні додати це до свого питання.
smci

Відповіді:


14

Glmnet призначений для пружної регресії сітки. Це штрафує розмір розрахункових коефіцієнтів (за допомогою суміші штрафних санкцій L1 та L2). Він намагається пояснити якомога більше розбіжностей у даних через модель, зберігаючи малі коефіцієнти моделі. Ці слайди мені здаються корисними, щоб зрозуміти це.

Glm не використовує штрафний термін.

Я так розумію, що з еластичною сіткою ви можете прийняти певні ухили взамін зменшення дисперсії оцінювача. Отже, що найкраще повинно залежати від того, як ви визначаєте "найкраще" з точки зору зміщення та відхилення. (Наприклад, я знаю, що glmnet має переваги, коли у вас є багато можливостей порівняно із спостереженнями)


Здається, посилання порушено
ndoogan

посилання працює зараз
smci

Ну ви просто пояснюєте, що робить glmnet - але ОП посилався на ситуацію, коли ви встановлюєте лямбда = 0 в glmnet, і в такому випадку результат в принципі повинен повертати те саме, що і (непервізований) glm (окрім деяких невеликих числових цифр) відмінності, пов'язані з циклічним методом пристосування, що використовується у glmnet).
Том Венсельєр
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.