Я використовую пакет R штрафується отримати зморщені оцінки коефіцієнтів для набору даних , де у мене є багато провісників і мало знань, які з них мають важливе значення. Після того, як я вибрав параметри настройки L1 і L2, і я задоволений своїми коефіцієнтами, чи є статистично обгрунтований спосіб узагальнити підхід моделі з чимось на зразок R-квадрата?
Крім того, мені цікаво перевірити загальну значущість моделі (тобто R² = 0, чи все = 0).
Я прочитав відповіді на подібне запитання, яке я тут задавав , але це не зовсім відповіло на моє запитання. Про пакет R, який я тут використовую , є чудовий підручник , і автор Джеллі Геман в кінці підручника мав таку примітку щодо інтервалів довіри від пеналізованих регресійних моделей:
Цілком природним є запитання про стандартні похибки коефіцієнтів регресії або інших розрахункових величин. В принципі, такі стандартні помилки можна легко обчислити, наприклад, використовуючи завантажувальну систему.
І все-таки цей пакет їх свідомо не надає. Причиною цього є те, що стандартні помилки не мають великого значення для сильно упереджених оцінок, як-от виникають у результаті пеналізованих методів оцінки. Пеналізоване оцінювання - це процедура, яка зменшує дисперсію оцінювачів, вводячи істотні зміщення. Тому зміщення кожного оцінювача є головною складовою його середньої квадратичної помилки, тоді як його дисперсія може сприяти лише невеликій частині.
На жаль, у більшості застосувань пенізованої регресії неможливо отримати досить точну оцінку зміщення. Будь-які розрахунки на основі завантажувальної програми можуть давати оцінку лише дисперсійності оцінок. Надійні оцінки зміщення доступні лише за наявності надійних неупереджених оцінок, що, як правило, не відбувається в ситуаціях, коли застосовуються пеніалізовані оцінки.
Повідомлення про стандартну помилку штрафної оцінки означає лише частину історії. Це може створити помилкове враження великої точності, повністю ігноруючи неточність, викликану упередженням. Звичайно, помилково робити довіри, які ґрунтуються лише на оцінці дисперсії оцінок, таких як інтервали довіри на основі завантажувальної програми.