Чутливість BFGS до початкових наближень Гессі


9

Я намагаюся реалізувати метод Бройдена-Флетчера-Голдфарба-Шенно, щоб знайти мінімум функції. Мені потрібні два початкові здогадки & та початкове наближення матриці . Єдині вимоги, які я знаходжу до - це те, що якщо гессіан є симетричним позитивним певним, то також повинен бути . Дивлячись на wikipedia, я бачу, що типовим початковим наближенням є (матриця тотожності). Це завжди хороший початковий ? Чи є якась причина, чому я можу вибрати щось, крім ? Чи могли б інші варіанти B, які задовольняють однакові властивості матриці, сильно вплинули на збіжність методу? x1x0B0B0B0B0=IB0I

Відповіді:


6

Якщо у вас є виправданий Гесс наближення, то краще використовувати його , а не довільна .B0=I

Редагувати: Обґрунтування полягає в тому, що якщо ви починаєте близько до рішення , початкова швидкість конвергенції (для будь-якого ) -ступенева лінійна з коефіцієнтом збіжностіякщо це для деякої корекції корекції матриці тотожності. Таким чином, намагатися зробити це маленьке дуже цінним. (Це еквівалентно попередньою умовою системи.) Коефіцієнт конвергенції з часом поліпшується і в кінцевому підсумку наближається до нуля (суперлінійна конвергенція), але у багатьох реальних проблемах (особливо високомірних) ніколи не робиться достатньо ітерацій, щоб досягти надлінійного режиму. Таким чином, початкова швидкість є досить важливою.xr>0r+1r+1q=B01f(x)G<1rG

Один важливий випадок, коли вирішуються нелінійні задачі найменших квадратів (мінімізувати ), де наближення Гаусса-Ньютона початкового гессіана може бути обчислюється без потреби в другому похідному. Його використання робить метод BFGS афінним інваріантом, тобто інваріантом при лінійних перетвореннях як метод Ньютона, що, як правило, дуже вигідно.F(x)22B0=F(x0)TF(x0)x

Ще один важливий випадок, коли ви вирішуєте послідовність пов’язаних проблем. Часто перезапуск розв'язувача з остаточним наближенням Гессі попередньої проблеми значно зменшує кількість необхідних ітерацій.


Якщо очікується, що гессіан буде симетричним позитивним певним, будь-яка симетрична позитивна визначена матриця все одно призведе до конвергенції, але швидкість конвергенції базується на тому, наскільки нагадує гессіанського? B0B0
Пол

Ні, зрештою, BFGS забуває про стартову матрицю, тому конвергенція як завжди має той самий порядок. Але це, звичайно, не цікаво, адже ти ніколи не робиш нескінченно багато кроків. k
Вольфганг Бангерт

@Paul: Дивіться мою редакцію.
Арнольд Ноймаєр
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.