Запитання з тегом «dynamic-programming»

3
Коли виходить з ладу оптимальне управління (?)
Для того, щоб "задати своє запитання", я спочатку повинен вирішити модель. Я пропущу кілька кроків, але все-таки це неминуче зробить цю публікацію дуже довгою, тому це також є тестом, щоб дізнатися, чи подобається цій громаді такі питання. Перш ніж почати, я уточнюю, що це може виглядати повністю як стандартна неокласична …

1
Розв’язування рівняння Гамільтона-Якобі-Беллмана; необхідні та достатні для оптимальності?
Розглянемо наступне диференціальне рівняння де - стан, а - змінна. Рішення задається через де заданий початковий стан.x˙(t)=f(x(t),u(t))x˙(t)=f(x(t),u(t))\begin{align} \dot x(t)=f(x(t),u(t)) \end{align}xxxuuux(t)=x0+∫t0f(x(s),u(s))ds.x(t)=x0+∫0tf(x(s),u(s))ds.\begin{align} x(t)=x_0 + \int^t_0f(x(s),u(s))ds. \end{align}x0:=x(0)x0:=x(0)x_0:=x(0) Тепер розглянемо наступну програму де \ rho> 0 позначає перевагу в часі, V (\ cdot) - значення, а F (\ cdot) об'єктивна функція. Класичним економічним застосуванням …

6
Посилання на вивчення динамічного програмування безперервного часу
Хтось знає хороших посилань, щоб вивчити динамічне програмування безперервного часу? Посилання не повинні бути книгами. Вони також можуть бути посиланнями на Інтернет-ресурси. Посилання на чіткі, стислі обговорення навіть лише основ допоможуть.

1
Відгадай і перевіри
У динамічному програмуванні метод невизначених коефіцієнтів іноді відомий як "здогадайся і перевіри". Я періодично чув, що є канонічні здогадки. Зокрема, я бачив V(k)=A+Bln(k)V(k)=A+Bln⁡(k)V(k) = A + B\ln(k) V(k)=Bk1−σ1−σV(k)=Bk1−σ1−σV(k) = \frac{Bk^{1-\sigma}}{1-\sigma} Перший стосується утиліти журналу, тоді як другий пов'язаний з налаштуваннями CRRA. Які ще канонічні здогадки існують і чи загалом вони …

2
Кілька рівноваг: яку вибрати?
Є два агенти i=1,2i=1,2i=1,2 . Розглянемо наступну програму s.t. V1(x0):=maxu∫∞0e−ρtF1(x(t),u(t),v(t))dtV2(x0):=maxv∫∞0e−ρtF2(x(t),u(t),v(t))dtx˙(t)=f(x(t),u(t),v(t))x(0)=x0V1(x0):=maxu∫0∞e−ρtF1(x(t),u(t),v(t))dtV2(x0):=maxv∫0∞e−ρtF2(x(t),u(t),v(t))dts.t. x˙(t)=f(x(t),u(t),v(t))x(0)=x0\begin{align} &V_1(x_0) := \max_u \int^\infty_0 e^{-\rho t}F_1(x(t),u(t),v(t))dt\\ &V_2(x_0) := \max_v \int^\infty_0 e^{-\rho t}F_2(x(t),u(t),v(t))dt\\ s.t.~&\dot x(t)=f(x(t),u(t),v(t))\\ &x(0) = x_0 \end{align}ρ>0ρ>0\rho > 0Vi(⋅)Vi(⋅)V_i(\cdot)Fi(⋅)Fi(⋅)F_i(\cdot)x∈X=[0,2]x∈X=[0,2]x\in X = [0,2]u∈U=[0,1]u∈U=[0,1]u\in U=[0,1]v∈V=[0,1]v∈V=[0,1]v\in V=[0,1]f(⋅)f(⋅)f(\cdot)ρV1(x)=maxu[F(x,u,v∗)+V′1(x)f(x,u,v∗)],∀t∈[0,∞)ρV2(x)=maxv[F(x,u∗,v)+V′2(x)f(x,u∗,v)],∀t∈[0,∞)ρV1(x)=maxu[F(x,u,v∗)+V1′(x)f(x,u,v∗)],∀t∈[0,∞)ρV2(x)=maxv[F(x,u∗,v)+V2′(x)f(x,u∗,v)],∀t∈[0,∞)\begin{align} \rho V_1(x)=\max_u [F(x,u,v^*) + V_1'(x)f(x,u,v^*)],\quad \forall t\in[0,\infty)\\ \rho V_2(x)=\max_v [F(x,u^*,v) + V_2'(x)f(x,u^*,v)],\quad \forall t\in[0,\infty)\\ …

1
Спільне динамічне програмування: Групова діяльність
Тут ми маємо двох агентів, які можуть витрачати свій час на виконання деякої групової діяльності ($ h $) або перебування вдома ($ l $). Кожен агент $ i $ намагається максимізувати свою відповідну задачу динамічного програмування: старт {align} & amp; максимум ^ infty_ {t = 0} beta ^ t h …

1
Посилання на найбільш використовувані корисні функції в макроекономічних проблемах міжтемпоральної оптимізації
Я шукаю посилання на найбільш використовувані функції корисності в макроекономічних проблемах міжтемпоральної оптимізації. Переважно, довідник повинен містити перелік властивостей цих функцій та те, чому вони зазвичай використовуються. Будь-яка допомога буде вдячна

0
Гамільтон-Якобі-Беллман з неоднорідними ставками дисконтування
i=1,2i=1,2i=1,2xxxuiuiu_iiiix˙=f(x,u1,u2)x˙=f(x,u1,u2)\dot x = f(x,u_1,u_2)Fi(x,u1,u2)Fi(x,u1,u2)F_i(x,u_1,u_2)V(x(0)):=maxu1,u2∫∞0(e−r1tF1(x,u1,u2)+e−r2tF2(x,u1,u2))dtV(x(0)):=maxu1,u2∫0∞(e−r1tF1(x,u1,u2)+e−r2tF2(x,u1,u2))dt\begin{align} V(x(0)) := \max_{u_1,u_2}\int^\infty_0{(e^{-r_1t}F_1(x,u_1,u_2) + e^{-r_2t}F_2(x,u_1,u_2))dt} \end{align} де - швидкість перевага часу. Мені було цікаво, як застосувати Гамільтона-Якобі-Беллмана в цьому випадку. Чи можливо щось подібне? ri>0ri>0r_i > 0r1+r22V(x)=maxu1,u2{F1(x,u1,u2)+F2(x,u1,u2)+V′(x)f(x,u1,u2)}r1+r22V(x)=maxu1,u2{F1(x,u1,u2)+F2(x,u1,u2)+V′(x)f(x,u1,u2)}\begin{align} \frac{r_1+r_2}{2}V(x) = \max_{u_1,u_2}\{F_1(x,u_1,u_2) + F_2(x,u_1,u_2) + V'(x)f(x,u_1,u_2)\} \end{align}
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.