Інтуїтивна мотивація для оновлення BFGS


15

Я викладаю заняття з чисельного аналізу та шукаю мотивацію для методу BFGS для студентів з обмеженим досвідом та інтуїцією в оптимізації!

J k ( x k - x k - 1 ) = f ( x k ) - f ( x k - 1 )Jк-Jк-1Fro2Jк(хк-хк-1)=f(хк)-f(хк-1)

Виведення оновлень BFGS здається набагато більш затятими та мутними! Зокрема, я хотів би не вважати апріорі, що оновлення повинно бути ранг-2 або приймати певну форму. Чи існує коротка варіативно мотивація оновлення BESG Hessian, як у Бройдена?


4
Якщо ви дозволите довільне оновлення, то ви можете просто використовувати повний гессіан у методі Ньютона. Однією з основних обчислювальних переваг оновлення низького рангу є те, що воно дозволяє дуже швидко оновлювати факторизацію приблизної Гессі.
Брайан Борчерс

Відповіді:


12

Виведення BFGS є більш інтуїтивним, якщо враховувати (строго) опуклі функціонали витрат:

x k f f ( x k + p ) f ( x k ) + f ( x k ) T p + 1

f(х)хвхRн.
хкfp ( ) x k + 1 : = x k + p ( ) p H ( x k ) [ x k + 1 - x k ] = f ( x k + 1 ) - f ( x k ) , Н
f(хк+p)f(хк)+f(хк)Тp+12pТН(хк)p.()
p()хк+1: =хк+p()p"- і встановлення його в нуль дає відношення де - ' Якобій градієнта 'або матриця Гессі.
Н(хк)[хк+1-хк]=f(хк+1)-f(хк),
Н

Оскільки обчислення та інверсія гессена коштує дорого ...


... коротка відповідь

(пор. оновлення Бройдена), можливо, що оновлення BFGS мінімізує у розумно обраній зваженій нормі Фробеніуса, на темуH - 1 k - H - 1WНк+1-1

Нк-1-Н-1W
  1. Н[хк+1-хк]=f(хк+1)-f(хк) - це те, для чого виходить - і
  2. НТ=Н , тому що гессіан симетричний.

Тоді вибір ваги в як зворотна усередненої Гессе , пор. тут для твердження, але без доказів, наводиться формула оновлення (з ).WНW: =W1/2НW1/2Ж Г: =01Н(хк+τp)гταк=1

Основні моменти:

  • Спробуємо наблизити рішення до фактичних витрат рішенням для квадратичного наближення
  • Розрахунок Гессі та його зворотного коштує дорого. Один віддає перевагу прості оновлення.
  • Оновлення вибирається оптимальним для зворотного, а не власне гессіанського.
  • Те, що це оновлення 2-го рангу, є наслідком конкретного вибору ваг у нормі Фробеніуса.

Більш довга відповідь повинна містити, як вибрати ваги, як зробити цю роботу для непопуклих проблем (де з'являється умова кривизни, що вимагає масштабування напрямку пошуку ), і як отримати фактичну формулу оновлення. Посилання тут (німецькою мовою).p


WW

Так, правда. Ну, я не знаю. Одна з відповідей полягає в тому, що вона дає просту для обчислення і добре працюючу формулу оновлення. Історично такий підхід до оновлення - мінімізуючи різницю в оновленнях - застосовував Шенно. Рефері (Голдфарб) встановив, що конкретний вибір ваг призводить до формули Бройдена та Флетчера. Дивіться цю кандидатську дисертацію Історичний розвиток сеансового методу BFGS ... для інтуїцій розробників BFGS. Однак усі 3 підходи досить абстрактні.
січня

1
Цікаво, дякую за вказівки! Моя поточна реєстрація (з деякими математичними помилками, які потребують допомоги) тут: graphics.stanford.edu/courses/cs205a-13-fall/assets/notes/… (якщо ви хочете отримати кредит за вашу допомогу, я радий надати її - напишіть мені, будь ласка, відповідну контактну інформацію)
Джастін Соломон

Н(хк)[хк+1-хк]=f(хк+1)-f(хк)
Н(хк+1)[хк+1-хк]=f(хк+1)-f(хк)?
Нк+1ск=укск=хк+1-хк,ук=fк+1-fк
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.