Коротше кажучи, перевага полягає в тому, що для обчислення похідних зменшеної мети вам не потрібно знати похідну стосовно як окремий об'єкт, але лише ту його частину, яка призводить до варіацій .u ( β ) β I ( β , u ( β ) )Я( β, u ( β) )u ( β)βЯ( β, u ( β) )
Дозвольте мені перейти до позначень, які мені трохи зручніше:
( є проектна змінна, - змінна стану, а - об'єктивна). Скажімо, досить приємно, щоб застосувати теорему неявної функції, тому рівняння має унікальне рішення яке постійно диференціюється щодо та похідної задається рішенням
( і є частковими похідними) .u y J e ( y , u ) e ( y , u ) = 0 y ( u ) u y ′ ( u ) e y ( y ( u ) , u ) y ′ ( u ) + e u ( y ( u ) , u )
хву, уJ( у, у )на темуе ( у, u ) = 0
ууJе ( у, у )е ( у, u ) = 0у( і )уу'( і ) eyeuеу( у( u ) , u ) y'( u ) + eу( у( u ) , u ) = 0(1)
еуеу
Це означає, що ви можете визначити зменшену ціль , яка також диференціюється (якщо є). Один із способів характеризувати градієнт - це через похідні спрямованості (наприклад, обчислити всі часткові похідні стосовно основи проектного простору). Тут похідна спрямованість у напрямку задається правилом ланцюга як
Якщо хороший, єдине складне для обчислення - для заданої . Це можна зробити, помноживши наJ ( у , у ) ∇ J ( U ) ч J ' ( у ; ч ) = ⟨ J у ( у ( у ) , у ) , у ' ( у ) ч ⟩ + ⟨ J у ( у (j ( u ) : = J( у( u ) , u )J( у, у)∇ j ( u )годJy′(u)hh(1)hy′(u)h [ y ′ ( u ) h ] = e y ( y ( u ) , u ) - 1 [ e u ( y ( u ) , u ) год ]
j'( U ; ч ) = ⟨ Jу(у( u ) , u ) , y'( У ) ч ⟩ + ⟨ Jу(у( U ) , U ) , ч ⟩ .(2)
Jу'( у ) годгод( 1 )годправоруч і рішення для (що дозволяє теорема неявної функції), тобто обчислення
та підключення цього виразу до . У обмеженій PDE оптимізації це означає вирішення лінеаризованого PDE
для кожного базового вектора проектного простору.
у'( у ) год[ у'( u ) h ] = eу( у( u ) , u )- 1[ еу( у( u ) , u ) h ](3)
год( 2 ) год
Однак якщо ми знайдемо оператора таким, що
то це повинен бути бажаний градієнт. Дивлячись на , ми можемо записати
(якщо є суміжним оператором), тому все, що нам потрібно для обчислення, є . Використовуючи це , це можна зробити за допомогою , тобто
і встановлення
У обмеженій PDE оптимізації∇ j
j'( U ; ч ) = ⟨ ∇ J , ч ⟩за всі години ,
( 1 )⟨ Jу(у( u ) , u ) , y'( У ) ч ⟩ = ⟨ у'( і )∗Jу( у( U ) , U ) , ч ⟩
у'( і )∗у'( і )∗jу( у( u ) , u )( A B )∗= В∗А∗( 3 )λ : = eу(у( u ) , u )- ∗Jу(у( u ) , u )
∇ j ( u ) = eу(у( u ) , u )∗λ + Jу(у( u ) , u ) .
Jу(у( u ) , u )зазвичай є деяким залишковим, і обчислення включає вирішення
єдиного (лінійного) суміжного PDE, незалежного від розмірності проектного простору. (Насправді, це працює навіть для розподілених параметрів, тобто, якщо - функція в деякому нескінченномірному просторі Банаха, де перший підхід неможливий.)
λу