Група 1 :
Складність / швидкість групи 1. здається не надто складно розібратися, якщо використовуються алгоритми грубої сили (хоча можуть бути і більш ефективні альтернативи, такі як алгоритм "стрибків і меж"). Наприклад, для повного вибору підмножини знадобиться регресії K, щоб задати пул функцій K- кандидата. Пристосування OLS однієї лінійної регресії має складність O ( K 2 n ) (відповідно до цього посту ), де n - розмір вибірки. Отже, загальна складність вибору повного підмножини грубої сили повинна становити O ( 2 K K 22KKO(K2n)n .O(2KK2n)
Група 2 :
Складність / швидкість групи 2. обговорюється в розділах 3.8 та 3.9 книги. Наприклад, регресія хребта з заданим покаранням має таку ж обчислювальну складність, як і звичайна регресія. Оскільки λ потрібно знайти за допомогою перехресної перевірки, обчислювальне навантаження збільшується лінійно в кількості розбиття даних, використовуваних при перехресній валідації (скажімо, S ). Якщо сітка λ має L точок, то загальна складність регресії хребта з настройкою параметра λ буде O ( L S K 2 n ) .λλSλLλO(LSK2n)
У книзі є досить багато розмов про ЛАССО , але я не зміг знайти те, що мені потрібно. Однак я знайшов на с. 443 Efron et al. "Найменший кут регресії" (2004), що складність LASSO для даного така ж, як і складність OLS-приладу лінійної регресії, якщо використовується метод LARS. Тоді загальна складність LASSO з налаштуванням параметра λ буде O ( L S K 2 n ) . (Я не читав уважно цей папір, тому, будь ласка, виправте мене, якщо я помилився з цим.) Еластична сітка поєднує хребет та LASSO; обидві мають однакову складність обчислювальної техніки; отже, складність еластичної сітки повинна бутиλλO(LSK2n)
де A - розмір сітки параметру настройки α, який врівноважує ваги гребеня проти LASSO.O(ALSK2n)Aα
Група 3 :
Я все ще не пропускаю жодної примітки щодо складності / швидкості для групи 3, яка складається з основних регресій компонентів (PCR) та часткових найменших квадратів (PLS).