Розглянемо наступне диференціальне рівняння де - стан, а - змінна. Рішення задається через де заданий початковий стан.
Тепер розглянемо наступну програму де \ rho> 0 позначає перевагу в часі, V (\ cdot) - значення, а F (\ cdot) об'єктивна функція. Класичним економічним застосуванням є модель оптимального зростання Ramsey-Cass-Koopmans. Рівняння Гамільтона-Якобі-Беллмана задається через \ begin {align} \ rho V (x) = \ max_u [F (x, u) + V '(x) f (x, u)], \ quad \ forall t \ in [0, \ infty). \ end {align}
Скажімо , я вирішував HJB для . Оптимальне керування потім задається через
У статті вікі йдеться
... але коли вирішується на всьому просторі стану, рівняння HJB є необхідною і достатньою умовою для оптимуму.
У Bertsekas (2005) Динамічне програмування та оптимальне керування , т. 1, 3-е видання, у пропозиції 3.2.1, він стверджує, що розв’язання для є оптимальною функцією затрат на рух, а пов'язане з ним є оптимальним. Однак він прямо заявляє це як теорему достатності.
Насправді, я просто хочу переконатися, що якщо я вирішую HJB і відновляю пов'язані траєкторії стану та керування, мені не доведеться турбуватися про додаткові умови оптимальності.
Рішення
Я намагаюся
Я думаю, що мені вдалося вивести необхідні умови з максимального принципу самим рівнянням HJB.
Визначте гамільтонів start
тоді ми маємо
що
Визначте довільну функцію з . Тепер виправте q ( 0 ) = lim t → ∞ q ( t ) = 0 x = x ∗ + ε q
де - параметр. Підключіть термін до максимізованого гамільтоніана, який дає ρ V ( x ∗ + ε q ) = H ( x ∗ + ε q , u ∗ , V ′ ( x ∗ + ε q ) ) .
При маємо оптимальне рішення. Таким чином, різниться над щоб отримати умову першого порядку
Тепер визначте суміжну змінну за допомогою
Диференціюйте з часом
і зауважте, що
Підключіть все те, що дає
Ось це досить багато. Тож рішення HJB дійсно необхідне та достатнє (тут опущено) для оптимальності. Хтось повинен додати його у вікі. Ви можете заощадити час для людей, які задумуються над такими проблемами (я вважаю, що це не так багато).
Однак умова поперечності відсутня.
II Спроба
Визначте функціонал виплат
Зауважте, що за визначенням . Додайте нейтральний термін до функціональної виплати start
Інтеграція за частинами потрібного доданку і виходу rhs
Замініть цей термін
Визначте
що дає
FOC для максимуму
Оскільки і не обмежені, ми повинні мати