Якщо у вас є виправданий Гесс наближення, то краще використовувати його , а не довільна .B0=I
Редагувати: Обґрунтування полягає в тому, що якщо ви починаєте близько до рішення , початкова швидкість конвергенції (для будь-якого ) -ступенева лінійна з коефіцієнтом збіжностіякщо це для деякої корекції корекції матриці тотожності. Таким чином, намагатися зробити це маленьке дуже цінним. (Це еквівалентно попередньою умовою системи.) Коефіцієнт конвергенції з часом поліпшується і в кінцевому підсумку наближається до нуля (суперлінійна конвергенція), але у багатьох реальних проблемах (особливо високомірних) ніколи не робиться достатньо ітерацій, щоб досягти надлінійного режиму. Таким чином, початкова швидкість є досить важливою.x∗r>0r+1r+1q=∥B−10f′′(x∗)−G∥<1rG
Один важливий випадок, коли вирішуються нелінійні задачі найменших квадратів (мінімізувати ), де наближення Гаусса-Ньютона початкового гессіана може бути обчислюється без потреби в другому похідному. Його використання робить метод BFGS афінним інваріантом, тобто інваріантом при лінійних перетвореннях як метод Ньютона, що, як правило, дуже вигідно.∥F(x)∥22B0=F′(x0)TF′(x0)x
Ще один важливий випадок, коли ви вирішуєте послідовність пов’язаних проблем. Часто перезапуск розв'язувача з остаточним наближенням Гессі попередньої проблеми значно зменшує кількість необхідних ітерацій.