Ці методи - ласо і еластична сітка - народилися з проблем як вибору особливостей, так і прогнозування. Я думаю, що через ці два об'єктиви можна знайти пояснення.
Меттью Ганн чудово пояснює у своїй відповіді, що ці дві цілі виразні і часто вирішені різними людьми. Однак, на щастя для нас, методи, які нас цікавлять, можуть добре працювати на обох аренах.
Вибір функції
Спочатку поговоримо про вибір функції. Спершу слід мотивувати еластичну сітку з точки зору ласо. Тобто, цитуючи Хасті та Зуу , "Якщо є група змінних, серед яких парні кореляції дуже високі, то ласо має тенденцію вибирати лише одну змінну з групи і не байдуже, яку саме обрано". Наприклад, це проблема, тому що це означає, що ми, мабуть, не знайдемо елемента справжньої підтримки за допомогою ласо - лише один, який сильно корелює з нею. (У статті йдеться про те, що це підтверджено в роботі LARS, яку я ще не читав.) Про труднощі відновлення підтримки за наявності кореляції також вказує Вайнрайт , коли існує висока кореляція між справжньою підтримкою та її доповненням.0.5
Тепер покарання l2 в еластичній сітці заохочує особливості, які мають коефіцієнти, які розглядаються як невідмінні лише за втратою, а штраф l1 мають рівні розрахункові коефіцієнти. Ми можемо це вільно бачити, помічаючи, що задовольняє | а | = | б(a,b)=argmina′,b′:c=|a′|+|b′|(a′)2+(b′)2. Завдяки цьому еластична сітка робить це таким чином, що ми рідше «випадково» зробимо зникнення оцінки коефіцієнта, що відповідає справжній опорі. Тобто справжня підтримка, швидше за все, міститиметься в межах оціночної підтримки. Це добре! Це означає, що є більше помилкових відкриттів, але це ціна, яку більшість людей готові платити.|a|=|b|
Як осторонь, варто зазначити, що той факт, що сильно корельовані характеристики мають, як правило, дуже схожі оцінки коефіцієнтів, робить це так, що ми можемо виявити групування ознак в межах оціночної підтримки, які впливають на відповідь аналогічно.
Прогнозування
Тепер переходимо до прогнозування. Як зазначає Метью Ганн, вибір параметрів настройки за допомогою перехресної перевірки створює мету вибрати модель з мінімальною помилкою передбачення. Оскільки будь-яка модель, обрана ласо, може бути обрана еластичною сіткою (приймаючи ), є певний сенс, що еластична сітка здатна знайти модель, яка прогнозує краще, ніж ласо.α=1
Ледерер, Ю. та Гайнанова ні в якому разі не припускають про особливості, що ласо і еластична сітка можуть бути помилкою прогнозування l2, обмеженою однаковою кількістю. Не обов'язково правда, що їхня межа обмежена, але це може бути цікаво відзначити, оскільки нерівності оракул, здається, є стандартним способом у статистичній літературі для кількісного визначення прогнозних показників оцінювачів - можливо, оскільки розподіли настільки складні! Варто також зазначити, що Lederer (1) (2) має деякі статті щодо прогнозування ласо за наявності корельованих ознак.
Підсумок
Підводячи підсумок, проблеми, що цікавлять, є справжньою підтримкою, яка знаходиться в межах передбачуваної підтримки та прогнозування. Для відновлення підтримки існують жорсткі перевірені гарантії (через Wainwright), що ласо вибирає правильні функції, які будуть в моделі, за умови, що низька кореляція між справжньою підтримкою та її доповненням. Однак за наявності кореляції ми можемо повернутися до еластичної сітки, щоб з більшою ймовірністю вибрати функції справжньої опори, щоб бути серед усіх, що вона вибирає. (Зверніть увагу, що ми повинні ретельно підбирати параметри настройки тут.) І для прогнозування, коли ми вибираємо параметр настройки шляхом перехресної перевірки, має інтуїтивний сенс, що еластична сітка повинна працювати краще, ніж ласо - особливо за наявності кореляції .
Відклавши передбачення та певну формальність, чого ми дізналися? Ми дізналися про справжню підтримку.
Інтервали довіри
Варто зазначити, що за останні 2 роки багато що змінилося щодо дійсного висновку для ласо. Зокрема, робота Лі, Сонця, Сонця та Тейлора дає точні умовиводи щодо коефіцієнтів ласо, обумовлених вибраною моделлю. (Результати висновку в ласо для справжніх коефіцієнтів були приблизно на час посади ОП, і вони добре підсумовані у зв'язаному документі.)