Внутрішня жалість в онлайновій опуклої оптимізації


19

"Оптимізація опуклості в Інтернеті" Зінкевича ( http://www.cs.cmu.edu/~maz/publications/ICML03.pdf ) узагальнює алгоритми навчання "мінімізації жалю" від лінійних налаштувань до опуклих налаштувань і дає хороший "зовнішній жаль" . Чи є подібне узагальнення щодо внутрішнього жалю? (Я не зовсім впевнений, навіть що саме це означатиме.)


Чи можна до запитання додати короткий опис внутрішнього жалю?
Моріц

У звичайних "експертах" встановлення внутрішнього жалю означає, що в ретроспективі ви не хочете перемикати одну дію на іншу, послідовно впродовж усієї історії. Папір Blum-Мансур, ймовірно , є найкращим орієнтиром для внутрішніх проти зовнішнього жалю: jmlr.csail.mit.edu/papers/volume8/blum07a/blum07a.pdf
Ноам

Відповіді:


9

Спробуйте "Не шкодуйте навчання в опуклих іграх" Гордона, Грінвальда та Марка http://portal.acm.org/citation.cfm?id=1390202 . Анотація звучить так, що, ймовірно, відповідає на ваше запитання, або принаймні хтось, хто відповідає на це питання, цитуватиме або цитуватиметься у цьому документі.


0

Цей документ Avrim Blum вказує на зв’язок між зовнішнім та внутрішнім жалем. Згідно з його анотацією, зовнішнє жалю - це міра того, наскільки поганий алгоритм порівнюється з найкращою фіксованою дією, тоді як внутрішнє жалю порівняно з найкращою варіацією цього методу (найкраща фіксована перестановка виходів, як клас звітування A кожного разу, коли початковий алгоритм повідомляв клас Б).


1
Документ Blum-Mansour полягає не в налаштуванні "опукла оптимізація в Інтернеті", а в лінійному режимі "експертів". Моє запитання полягає в тому, чи можна застосовувати щось подібне чи інший алгоритм прямого внутрішнього жалю в опуклому режимі.
Ноам
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.