Методи Квазі-Ньютона, які наближають гессіана на основі відмінностей градієнтів за декількома ітераціями, накладаючи умову "сексанта" (Квазі-Ньютона). Існує багато різних методів Квазі-Ньютона, які оцінюють гессіана по-різному. Один з найпопулярніших - BFGS. Наближення Гессі BFGS може бути або засноване на повній історії градієнтів, і в цьому випадку воно називається BFGS, або може базуватися лише на останніх m градієнтах; у цьому випадку воно відоме як обмежена пам'ять BFGS, скорочено як L-BFGS. Перевага L-BFGS полягає в тому, що потрібно лише зберігати найновіші m градієнти, де m зазвичай становить приблизно від 10 до 20, що набагато менша вимога зберігання, ніж n * (n + 1) / 2 елементів, необхідних для зберігання повних (трикутник) оцінки Гессі, як це потрібно для BFGS, де n - розмір проблеми. На відміну від (повної) BFGS, оцінка гессі ніколи не формується і не зберігається в L-BFGS (хоча деякі реалізації BFGS лише формують та оновлюють коефіцієнт Чольського наближення Гессі, а не саме наближення Гессі); скоріше, розрахунки, які були б необхідні при оцінці гессі, здійснюються без явного формування. L-BFGS використовується замість BFGS для дуже великих проблем (коли n дуже великий), але може не працювати так добре, як BFGS. Тому BFGS є кращим перед L-BFGS, коли можуть бути задоволені потреби в пам'яті BFGS. З іншого боку, L-BFGS не може бути набагато гіршим за продуктивність, ніж BFGS. оцінка Гессі ніколи не формується і не зберігається в L-BFGS (хоча деякі реалізації BFGS лише формують та оновлюють коефіцієнт Чольського наближення Гессі, а не саме наближення Гессі); скоріше, розрахунки, які були б необхідні при оцінці гессі, здійснюються без явного формування. L-BFGS використовується замість BFGS для дуже великих проблем (коли n дуже великий), але може не працювати так добре, як BFGS. Тому BFGS є кращим перед L-BFGS, коли можуть бути задоволені потреби в пам'яті BFGS. З іншого боку, L-BFGS не може бути набагато гіршим за продуктивність, ніж BFGS. оцінка Гессі ніколи не формується і не зберігається в L-BFGS (хоча деякі реалізації BFGS лише формують та оновлюють коефіцієнт Чольського наближення Гессі, а не саме наближення Гессі); скоріше, розрахунки, які були б необхідні при оцінці гессі, здійснюються без явного формування. L-BFGS використовується замість BFGS для дуже великих проблем (коли n дуже великий), але може не працювати так добре, як BFGS. Тому BFGS є кращим перед L-BFGS, коли можуть бути задоволені потреби в пам'яті BFGS. З іншого боку, L-BFGS не може бути набагато гіршим за продуктивність, ніж BFGS. розрахунки, які були б необхідні при оцінці гессі, виконуються без явного формування. L-BFGS використовується замість BFGS для дуже великих проблем (коли n дуже великий), але може не працювати так добре, як BFGS. Тому BFGS є кращим перед L-BFGS, коли можуть бути задоволені потреби в пам'яті BFGS. З іншого боку, L-BFGS не може бути набагато гіршим за продуктивність, ніж BFGS. розрахунки, які були б необхідні при оцінці гессі, виконуються без явного формування. L-BFGS використовується замість BFGS для дуже великих проблем (коли n дуже великий), але може не працювати так добре, як BFGS. Тому BFGS є кращим перед L-BFGS, коли можуть бути задоволені потреби в пам'яті BFGS. З іншого боку, L-BFGS не може бути набагато гіршим за продуктивність, ніж BFGS.