Математична оптимізація на галасливій функції

Нехай - функція, яка є досить приємною (наприклад, безперервна, диференційована, не надто багато локальних максимумів, можливо, увігнута тощо). Я хочу знайти максимум : значення що робить якомога більшим. $f:\mathbb{R}^d \to \mathbb{R}$ $f$ $x \in \mathbb{R}^d$ $f(x)$

Якби у мене була процедура точно оцінювати на будь-якому моєму вході, я міг би використати стандартні методи математичної оптимізації : сходження на гірку, спуск по градієнту (ну, градієнтне сходження) тощо. Однак у моїй заяві у мене немає спосіб точно оцінити . Натомість у мене є спосіб оцінити значення . $f$ $f(x)$ $f(x)$

Зокрема, з урахуванням будь-якого і будь-якого , у мене є оракул, який видасть оцінку , і очікувана помилка якої приблизно . Час запуску цього оракул виклику пропорційний . (Він реалізується за допомогою свого роду моделювання; точність моделювання зростає з квадратним коренем кількості випробувань, і я можу вибрати, скільки випробувань провести, щоб я міг вибрати бажану точність.) Отже, це дає мені спосіб отримати оцінку будь-якої точності, яку я бажаю, але чим точнішою я хочу бути, тим довше мені знадобиться. $x$ $\varepsilon$ $f(x)$ $\varepsilon$ $1/\varepsilon^2$

Враховуючи цей галасливий оракул для , чи існують методи для обчислення максимумів якомога ефективніше? (Або, точніше, знаходження приблизних максимумів.) Чи існують варіанти сходження на пагорби, схил градієнта тощо, які працюють у цій моделі? $f$ $f$

Звичайно, я міг зафіксувати дуже мале значення і застосувати сходження на схил або схил по схилу за допомогою цього оракула, зберігаючи однакове протягом усього часу. Однак це може виявитися невиправдано неефективним: нам може не знадобитися така точна оцінка з самого початку, тоді як точність біля кінця, коли ви занурюєтесь у рішення, важливіша. То чи є якийсь спосіб скористатися моєю здатністю динамічно контролювати точність моєї оцінки, щоб зробити процес оптимізації більш ефективним? Чи вивчали цю проблему раніше? $\varepsilon$ $\varepsilon$

optimization approximation

— DW
джерело

Схоже, що проблема оптимізації швидкості гарантує власну сферу дослідження. А як щодо імітованого відпалу? Чи можете ви адаптувати ідеї звідти - ймовірності переходу та температурний графік? Там є зв'язок - коли ви продовжуєте перепади температури, а у вашому випадку ви хочете

знизитися.

ϵ

$\epsilon$

— randomsurfer_123

кіберсинхронність, натрапила саме на цей випадок нещодавно в програмі GA. погодився з rs вище, що імітували відпал, коли точність оцінки функції приблизно відповідає зниженню температури. Інша ідея полягає у тому, щоб просто зробити фіксовану кількість зразків у кожній точці та взяти середню за оцінку. Більш просунута теорія може сказати вам лише, що ви не можете отримати щось дарма, і що немає ярлика до оцінок, що покращує оптимізацію.

— vzn

Точну функцію можна замінити на шумну функцію , де - штучний параметр, який використовується для опису залежності шуму, таким, що і містять шум. $f(x,p)$ $f(x+\Delta x, p + \Delta p)$ $p$ $\Delta x$ $\Delta p$

Можуть бути застосовані деякі методи, що застосовуються для стохастичної оптимізації та надійної оптимізації .
Тому що поблизу максимумів,менш небезпечний, ніж. $\frac{\partial f}{\partial x}\approx 0$ $\Delta x$ $\Delta p$
Іноді можна точно оцінити при оцінці. Часто це справедливо лише в теорії, оскільки воно не реалізоване, а деякі частини потребують особливого догляду. $\frac{\partial f}{\partial x}(\tilde{x}, \tilde{p})$ $f(\tilde{x}, \tilde{p})$
Бажана "малість" (і ) - рішення "кінцевого споживача". Можна запропонувати евристику для управління нею, але час виконання, пропорційний , занадто повільний, щоб повністю автоматично керувати точністю. $\Delta p$ $\Delta x$ $1/\epsilon^2$
Даний шум проти виконуваного часу - це те, що відрізняє цю проблему від краще вивчених проблем. Проблеми полягали в тому, що шум просто неминучий, вони більш поширені і краще вивчені.

— Томас Клімпель
джерело

Дякую за ідею. Я трохи намагаюся зрозуміти, що саме означатиме ця заміна і як вона допомагає. Чи це еквівалент заміни

на

? Я не впевнений, як зрозуміти

: якщо я правильно зрозумію вашу пропозицію, вона буде виправлена, і я не можу вибрати щось (тому без втрати загальності ми можемо також встановити

і поглинають будь-яку залежність у визначенні

f (x, p)

$f(x,p)$

f^{*} (x + Δ x, Δ p)

$f^*(x+\Delta x,\Delta p)$

p

$p$

p = 0

$p=0$

f^{*}

$f^*$ ). Стохастична оптимізація та надійна оптимізація виглядають як більш-менш такі речі, які я шукав, тому це дуже корисно. Дякую.

— DW

@DW Так, ви можете встановити

. Тоді шумний варіант

. Як було сказано,

містять шум. Точніше, вони не просто містять шум, вони шум.

p = 0

$p=0$

f (x, 0)

$f(x,0)$

f (x + Δ x, Δ p)

$f(x+\Delta x, \Delta p)$

Δ x

$\Delta x$

Δ p

$\Delta p$

— Томас Клімпель