Легко зрозумілий аргумент про те, що звичайні методи Runge – Kutta не можна узагальнити до SDE?


9

Наївним підходом до розв’язання стохастичних диференціальних рівнянь (SDE) був би:

  • скористатися звичайним багатоступеневим методом Рунге-Кутта,
  • використовувати достатньо тонку дискретизацію основного процесу Вінера,
  • зробити кожен крок методу Рунге – Кутта аналогічним Ейлеру – Маруямі.

Тепер це не вдається на кількох рівнях, і я розумію, чому. Однак тепер я маю на меті переконати людей у ​​цьому факті, які мало знають про методи Рунге-Кутти та стохастичні диференціальні рівняння. Усі аргументи, про які я усвідомлюю, - це ніщо, з чим я можу добре спілкуватися в даному контексті. Отже, я шукаю легко зрозумілий аргумент, що вищезазначений підхід приречений.


@BiswajitBanerjee: Я це усвідомлюю і дійсно не стверджую, що я зрозумів це якомога глибше. Але я не думаю, що надання всіх аргументів тут покращить відповідь, оскільки ті, хто може надати відповідь, про них знають. Більше того, цей випадок є дещо особливим, оскільки йдеться про пояснення, чому щось не працює, на що, природно, є багато відповідей, починаючи з того, що "ми це перевірили, і це не вдалося".
Wrzlprmft

Я говорив не про експертів зі стохастичних ODE, а про середнього читача, який розуміє випадкові змінні та РК, коли я сказав "ми". Однак я не буду вас більше турбувати, якщо ви не хочете навести приклад свого мислення.
Biswajit Banerjee

Відповіді:


13

Візьмемо стохастичне диференціальне рівняння:

Хт=f(т,Хт)гт+г(т,Хт)гWт

Ось кілька різних аргументів, які призводять до інтуїтивного розуміння того, чому необхідна математика за методами вищого порядку. Я буду обговорювати з точки зору сильного порядку, що те саме, що сказати "для даного броунівського рухуW(т), наскільки добре числовий інтеграл вирішує цю траєкторію? "

Правильність рівняння

Перш за все, запропонований вами метод не враховує той факт Хтне є постійно диференційованим. Насправді, ви можете використовувати результати Росслера, щоб показати, що розширення звичайних методів РК, як ви запропонували, призведе до конвергентних методів, але вони матимуть лише сильний порядок 0,5. Причина полягає в тому, що вони були отримані за допомогою обчислення зХтбути диференційованим і мати серію Тейлора. Броунівський рух не є диференційованим, а натомість має тривалість Холдераα<0,5 як

Однак, як і в теорії збурень, процеси, які є недостатньо регулярними, не розширюються з точки зору серії Тейлора, але з регулярністю Холдера α їх можна розширити з точки зору серії Puiseux з термінами α, тобто для броунівського руху існує розширення до поняття серії Тейлора, яке розгорнуте в плані чогось подібного 12похідні. Як і в звичайному обчисленні, перший термін - це "лінійний термін", тобто змінагт до Δт і гWт до N(0,гт)і ви щось розумієте правильно. Ось чому методи, включаючи такі речі, як Ейлер-Маруяма, зближуються із сильним порядком 0,5: вони отримують перший член у серії Тейлора правильним. Однак умови вищого порядку повинні виправляти той фактХт не є постійно диференційованим, через що звичайні методи не роблять цього.

Миттєві кореляції та ітеровані інтеграли

Це швидке евристичне пояснення, але в цьому є трохи більше. Давайте розглянемо кілька інших деталей. Серія Тейлора - це не просто розширення з точки зору похідних, але це також може вважатися числом термінів вищого порядку для інтеграції.Хт=Х0+Δтf(т,Хт)інтегрується один раз. Але якщо ви додастегт2 Термін, щоб визначити правильність одиниць, потрібно зробити подвійні інтеграли. гт2 легко інтегрувати двічі, але що таке гWтiгWтj? Це миттєві співвідношення між броунівськими рухами. Вам потрібно знати це для обчислення подвійного інтеграла. Якщо ви дивитесь лише на середні показники, можете зняти це. Але в будь-якій траєкторії є кореляції між різними броунівськими рухами системи диференціальних рівнянь. Якщо припустити, що немає кореляційних зв'язків між броунівськими рухами, це ще один спосіб характеризувати розширення Маруями детермінованих методів, але щоб отримати наступний член у серії (термін 1,0), ви повинні отримати це право. Виправлення Мільштейна саме додає ці кореляційні терміни. Коли шум є діагональним, це рівнозначно розумінню того, що кореляції, крім самого себе, немає, але кореляція з самими собою - це лише дисперсія, яка єгт, і тому має бути виправлення гWт2 проти гт, тобто гW2-гт. Коли виникає недіагональний шум, ці подвійні інтеграли повинні бути наближені таким чином, щоб враховувати миттєві кореляції броунівських рухів, і загальне наближення тут є наближенням Вікторссона, і саме це робить недіагональне моделювання шуму настільки складним (оскільки немає навіть аналітичного рішення для подвійних інтегралів).

Середній ефект дифузії

Але це призводить нас до іншого способу мислення щодо проблеми. Думаючи про розширення з точки зору моментів, в деякому евристичному сенсі термін першого порядку, сильний порядок 1,0 абоО(Δт)Термін, повинен мати правильні середні рухи, правда? Ось питання: від чого похіднагвчасно? Найпростішою відповіддю було б визначити похідну нормальним способом:

але це насправді не правильно під час розміщення гв контекст SDE. Якщо ми подумаємо про похідну відг з точки зору того, наскільки це змінюється Хт, це не завжди в середньому вказує в одному напрямку, оскільки він завжди множиться на цей випадковий коефіцієнт гWт. Питання: який середній розмір у цьомугWт? Дифузія має зміни в середньому за шкалоюΔт, так що насправді це впливає г(т,Хт) є більше схожий

г(т+Δт,Хт+Δт)-г(т,Хт)Δт

Ви можете більш жорстко показати, що числова похідна повинна бути такою Хт+Δт=Хт+г(т,Хт)Δт як "провісник вперед у часі".

Але інтуїтивно це просто розуміння середнього ефекту, який г має на траєкторії с Хт: о г(т,Хт)Δт. У методі Рунге-Кутта - внутрішній крок за часомci повинно бути наближенням значення Хт+ciΔтАле навіть з цього швидкого фізичного евристичного аргументу про дифузію ми бачимо, що просте розширення методу Рунге-Кутти вже в середньому неправильне: це неправильно г(т,Хт)ciΔтце ще один спосіб пояснити, чому це максимум сильний порядок 0,5 (дивно, що методи все ще працюють! Але ви можете віднести це до того, що сума етапів у методі RK повинна бути 1, і ця помилка дещо скасовується вихід). Цікаво, що цей евристичний аргумент йде досить глибоко, оскільки стохастичні методи Рунге-Кутти вищого порядку, такі як Росслер, мають виправлення, які точно пов'язані зг(т,Хт)Δт.

Висновок

Це 3 різні евристичні способи зрозуміти, чому вищі порядки повинні включати стохастичне обчислення. Вищі замовлення повинні враховувати той факт, що регулярність Холдера становить 1/2 і, отже, є додаткові терміни в серії Тейлора, вони повинні враховувати миттєві кореляції, і вони повинні принаймні враховувати середні ефекти терміну дифузії . В іншому випадку вони приречені не бути правильнимиО(Δт), а натомість задовольняють лише "лінійне наближення" першого доданка і отримують О(Δт).

Звичайно, за деяких обставин існують способи знайти відповідні узагальнення, які дають методи вищого порядку, але я залишу це як звисаюча нитка, тому що це один пункт статті, який я незабаром надсилаю. Сподіваюсь, це допомагає.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.