Що є більш точним glm чи glmnet?

R glm і glmnet використовують різні алгоритми.

Я помічаю нетривіальні відмінності між оціненими коефіцієнтами, коли використовую обидва.

Мене цікавить, коли один є більш точним, ніж інший, і час вирішити / точність торгувати.

Зокрема, я маю на увазі випадок, коли в glmnet st встановлюється лямбда = 0, він оцінює те саме, що і glm.

r generalized-linear-model glmnet

Ви запитуєте про відмінності в продуктивності та точності, коли лямбда = 0, де два теоретично повинні бути однаковими. Я думаю, ви повинні додати це до свого питання.

— smci

Glmnet призначений для пружної регресії сітки. Це штрафує розмір розрахункових коефіцієнтів (за допомогою суміші штрафних санкцій L1 та L2). Він намагається пояснити якомога більше розбіжностей у даних через модель, зберігаючи малі коефіцієнти моделі. Ці слайди мені здаються корисними, щоб зрозуміти це.

Glm не використовує штрафний термін.

Я так розумію, що з еластичною сіткою ви можете прийняти певні ухили взамін зменшення дисперсії оцінювача. Отже, що найкраще повинно залежати від того, як ви визначаєте "найкраще" з точки зору зміщення та відхилення. (Наприклад, я знаю, що glmnet має переваги, коли у вас є багато можливостей порівняно із спостереженнями)

— здогадки
джерело

Здається, посилання порушено

— ndoogan

посилання працює зараз

— smci

Ну ви просто пояснюєте, що робить glmnet - але ОП посилався на ситуацію, коли ви встановлюєте лямбда = 0 в glmnet, і в такому випадку результат в принципі повинен повертати те саме, що і (непервізований) glm (окрім деяких невеликих числових цифр) відмінності, пов'язані з циклічним методом пристосування, що використовується у glmnet).

— Том Венсельєр