Скажімо, ми знаходимося в дискретному просторі ймовірностей, щоб . Інтуїтивно вам потрібна деяка функція щоб ви могли оптимізувати . Ви можете оптимізувати лише одну ціль! U : R n → R U ( f ( x ) )f(x)∈RnU:Rn→RU(f(x))
Оптимізація однієї цільової функції може здатися досить стриманою, але це не так ! Скоріше одна мета може представляти неймовірно різноманітні переваги, які ви можете мати над тим, що є кращим чи гіршим рішенням.
Пропускаючи вперед, простим місцем для початку може бути вибір випадкової змінної а потім вирішення:λ
minimize (over x)subject toE[λf(x)]x∈X
Це просте лінійне повторне зважування . У будь-якому випадку, ось аргумент, чому згортання декількох цілей на одну ціль, як правило, нормально.
E[f(x)]
Основна настройка:
- У вас є вибір змінної і допустиме безліч .xX
- Ваш вибір призводить до випадкового результатуxy~=f(x)
- Ви маєте раціональні уподобання щодо випадкового результату. (В основному, ви можете сказати, чи віддаєте перевагу одному випадковому результату іншому.)≺y~
Ваша проблема полягає в тому, щоб вибрати таким чином:x∗∈X
∄x∈Xf(x∗)≺f(x)
Англійською мовою ви хочете вибрати щоб жоден здійсненний вибір призводив до результату, відданого перевагу .
x∗xf(x∗)
Еквівалентність максимальній корисності (за певних технічних умов)
Для технічної простоти я скажу, що ми знаходимося в дискретному просторі ймовірностей з результатами, тому я можу представляти випадковий результат з вектором .ny~y∈Rn
За певних технічних умов (які в практичному розумінні не обмежують) вищевказана проблема еквівалентна максимізації функції утиліти . (Функція корисності призначає більш бажані результати більшу кількість.)U(y)
Ця логіка застосовується до будь-якої проблеми, коли ваш вибір призводить до декількох змінних результатів.
maximize (over x)subject toU(f(x))x∈X
Надання більшої структури функції утиліти : Гіпотеза очікуваної корисності :U
Якщо ми перебуваємо у вірогідній обстановці і приймаємо аксіоми Неймана-Моргернстерна , загальна корисна функція повинна приймати особливу форму:U
U(y)=E[u(yi)]=∑ipiu(yi)
Де - ймовірність стану а - увігнута корисна функція. Кривизна вимірює відхилення від ризику. Просто замінивши цю спеціалізовану форму ви отримаєте:
piiuuU
maximize (over x)subject to∑ipiu(yi)x∈Xy=f(x)
Зауважте, що простий випадок - це максимізація очікуваного значення (тобто відсутність відхилення від ризику).u(yi)=yi
Інший підхід: вагиλ
Ще одне, що потрібно зробити:
maximize (over x)subject to∑iλiyix∈Xy=f(x)
Інтуїтивно ви можете вибрати ваги які є більшими або меншими, ніж ймовірність стану, що виникає, і це фіксує важливість стану.p iλipi
Більш глибоке обґрунтування цього підходу полягає в тому, що за певних технічних умов існує лямбда-ваги такі, що вищезазначена проблема та більш ранні проблеми (наприклад, максимізація ) мають однакове рішення.U ( f ( x ) )λU(f(x))