Застосовуючи регресію хребта для недостатньо визначеної системи рівнянь?


9

Коли , проблема найменших квадратів, яка накладає сферичне обмеження на значення може бути записана як ім'я для завищеної системи. \ | \ cdot \ | _2 - евклідова норма вектора.y=Xβ+eδβ

min yXβ22s.t.  β22δ2
2

Відповідне рішення β задається

β^=(XTX+λI)1XTy ,
які можна отримати за методом множників Лагранжа ( λ - множник):
L(β,λ)=yXβ22+λ(β22δ2)

Я розумію, що є властивість

(XTX+λI)1XT=XT(XXT+λI)1 .
Права сторона нагадує псевдо-зворотну матрицю регресора X у невизначеному випадку (із доданим параметром регуляризації λ ). Чи означає це, що той самий вираз може бути використаний для наближення β для недостатньо визначеного випадку? Чи існує окреме виведення для відповідного виразу у заздалегідь визначеному випадку, оскільки сферичне обмеження обмеження є надмірним з цільовою функцією (мінімальна норма β ):

min. β2s.t. Xβ=y .

Відповіді:


12

Починаючи з постановки проблеми регресії хребта як

minXβy22+λx22

Ви можете написати проблему як

minAβb22

де

A=[XλI]

і

b=[y0].

Матриця має повний ранг стовпця через частину . Таким чином, проблема найменших квадратів є унікальним рішеннямAλI

β^=(ATA)1ATb

Виписуючи це з точки зору та та спрощуючи багато 0, ми отримуємоXy

β^=(XTX+λI)1XTy

Ніщо в цій деривації не залежить від того, чи має більше рядків чи стовпців, чи навіть від того, чи має повний ранг. Таким чином, ця формула застосовна для невизначеного випадку. XX

Це алгебраїчний факт, що для ,λ>0

(XTX+λI)1XT=XT(XXT+λI)1

Таким чином, ми також маємо можливість використовувати

β^=XT(XXT+λI)1y .

Щоб відповісти на ваші конкретні запитання:

  1. Так, обидві формули працюють як для невизначеного випадку, так і для надвизначеного випадку. Вони також працюють , якщо менше мінімального числа рядків і стовпців . Друга версія може бути ефективнішою для невизначених проблем, оскільки в цьому випадку менший, ніжrank(X)XXXTXTX

  2. Мені невідомо жодне виведення альтернативної версії формули, яка починається з якоїсь іншої проблеми з найменшими квадратиками і використовує звичайні рівняння. У будь-якому випадку, ви можете отримати це прямо, використовуючи трохи алгебри.

Можливо, ви замислюєтесь про проблему регресії хребта у формі

minβ22

на тему

Xβy22ϵ.

Однак ця версія проблеми регресії хребта просто призводить до тієї ж задачі з найменшими затухаючими квадратами .minXβy22+λβ22


2
Варто зазначити, що відбувається в межах, коли переходить до 0, якщо має повний ранг рядка або повний ранг стовпця. Якщо має повний ранг стовпця, то в межі ви отримуєте псевдоінверс . Аналогічно, якщо має повний ранг рядка, то в межі ви отримуєте псевдоінверсію . Отже, це виходить так, як ми і очікували. λXX(XTX)1XTXXT(XXT)1
Брайан Борчерс

Це феноменально вичерпна відповідь, і виведення з доповнених масивів (плюс алгебри, яку я пропустив) дуже задовольняє. Я не думав про проблему регресії хребта у формі, яку ви представили наприкінці, але цікаво бачити, що це призводить до тієї ж цільової функції. Велике спасибі!
hatmatrix

1
Дякую. Я вставлю сюди безсоромний штекер. Ви можете знайти це (і багато пов'язаного з цим матеріалу) в підручнику щодо оцінки параметрів та зворотних проблем, які я спільно працював з Ріком Астером та Кліфом Турбером.
Брайан Борчерс

1
Додам також додати, що насправді обчислення цієї матриці обернено, як правило, не є найкращим способом використання цієї формули. В залежності від розміру і можливої розрідженості ви можете бути набагато краще використовувати итерационную схему або просто з допомогою Чолескі факторизации матриці . XXTX+λI
Брайан Борчерс

Дякуємо за ваші пропозиції! Я вдячний посиланням на вашу книгу, оскільки у мене виникли проблеми з підручником на цьому матеріалі. Наш розмір даних насправді не дуже великий (лише те, що нам, можливо, доведеться застосовувати це неодноразово для окремих наборів даних), тому вони можуть бути піддані прямому зворотному, але дякую за додаткові покажчики!
hatmatrix
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.