Математична оптимізація на галасливій функції


10

Нехай - функція, яка є досить приємною (наприклад, безперервна, диференційована, не надто багато локальних максимумів, можливо, увігнута тощо). Я хочу знайти максимум f : значення x R d, що робить f ( x ) якомога більшим.f:RdRfxRdf(x)

Якби у мене була процедура точно оцінювати на будь-якому моєму вході, я міг би використати стандартні методи математичної оптимізації : сходження на гірку, спуск по градієнту (ну, градієнтне сходження) тощо. Однак у моїй заяві у мене немає спосіб точно оцінити f ( x ) . Натомість у мене є спосіб оцінити значення f ( x ) .ff(x)f(x)

Зокрема, з урахуванням будь-якого і будь-якого ε , у мене є оракул, який видасть оцінку f ( x ) , і очікувана помилка якої приблизно ε . Час запуску цього оракул виклику пропорційний 1 / ε 2 . (Він реалізується за допомогою свого роду моделювання; точність моделювання зростає з квадратним коренем кількості випробувань, і я можу вибрати, скільки випробувань провести, щоб я міг вибрати бажану точність.) Отже, це дає мені спосіб отримати оцінку будь-якої точності, яку я бажаю, але чим точнішою я хочу бути, тим довше мені знадобиться.xεf(x)ε1/ε2

Враховуючи цей галасливий оракул для , чи існують методи для обчислення максимумів f якомога ефективніше? (Або, точніше, знаходження приблизних максимумів.) Чи існують варіанти сходження на пагорби, схил градієнта тощо, які працюють у цій моделі?ff

Звичайно, я міг зафіксувати дуже мале значення і застосувати сходження на схил або схил по схилу за допомогою цього оракула, зберігаючи однакове ε протягом усього часу. Однак це може виявитися невиправдано неефективним: нам може не знадобитися така точна оцінка з самого початку, тоді як точність біля кінця, коли ви занурюєтесь у рішення, важливіша. То чи є якийсь спосіб скористатися моєю здатністю динамічно контролювати точність моєї оцінки, щоб зробити процес оптимізації більш ефективним? Чи вивчали цю проблему раніше?εε


2
Схоже, що проблема оптимізації швидкості гарантує власну сферу дослідження. А як щодо імітованого відпалу? Чи можете ви адаптувати ідеї звідти - ймовірності переходу та температурний графік? Там є зв'язок - коли ви продовжуєте перепади температури, а у вашому випадку ви хочете знизитися. ϵ
randomsurfer_123

кіберсинхронність, натрапила саме на цей випадок нещодавно в програмі GA. погодився з rs вище, що імітували відпал, коли точність оцінки функції приблизно відповідає зниженню температури. Інша ідея полягає у тому, щоб просто зробити фіксовану кількість зразків у кожній точці та взяти середню за оцінку. Більш просунута теорія може сказати вам лише, що ви не можете отримати щось дарма, і що немає ярлика до оцінок, що покращує оптимізацію.
vzn

Відповіді:


4

Точну функцію можна замінити на шумну функцію f ( x + Δ x , p + Δ p ) , де p - штучний параметр, який використовується для опису залежності шуму, таким, що Δ x і Δ p містять шум.f(x,p)f(x+Δx,p+Δp)pΔxΔp

  • Можуть бути застосовані деякі методи, що застосовуються для стохастичної оптимізації та надійної оптимізації .
  • Тому що поблизу максимумів,Δxменш небезпечний, ніжΔp.fx0ΔxΔp
  • Іноді можна точно оцінити при оцінціf( ˜ x , ˜ p ). Часто це справедливо лише в теорії, оскільки воно не реалізоване, а деякі частини потребують особливого догляду.fx(x~,p~)f(x~,p~)
  • Бажана "малість" Δ x ) - рішення "кінцевого споживача". Можна запропонувати евристику для управління нею, але час виконання, пропорційний 1 / ϵ 2 , занадто повільний, щоб повністю автоматично керувати точністю.ΔpΔx1/ϵ2
  • Даний шум проти виконуваного часу - це те, що відрізняє цю проблему від краще вивчених проблем. Проблеми полягали в тому, що шум просто неминучий, вони більш поширені і краще вивчені.

Дякую за ідею. Я трохи намагаюся зрозуміти, що саме означатиме ця заміна і як вона допомагає. Чи це еквівалент заміни на f ( x + Δ x , Δ p ) ? Я не впевнений, як зрозуміти p : якщо я правильно зрозумію вашу пропозицію, вона буде виправлена, і я не можу вибрати щось (тому без втрати загальності ми можемо також встановити p = 0 і поглинають будь-яку залежність у визначенні f f(x,p)f(x+Δx,Δp)pp=0f). Стохастична оптимізація та надійна оптимізація виглядають як більш-менш такі речі, які я шукав, тому це дуже корисно. Дякую.
DW

@DW Так, ви можете встановити . Тоді шумний варіант f ( x , 0 ) - f ( x + Δ x , Δ p ) . Як було сказано, Δ x і Δ p містять шум. Точніше, вони не просто містять шум, вони шум. p=0f(x,0)f(x+Δx,Δp)ΔxΔp
Томас Клімпель
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.