Як працює пошук новинок?

16

У цій статті автор стверджує, що керування еволюцією лише новизною (без явних цілей) може вирішити проблеми навіть краще, ніж використання явних цілей. Іншими словами, використання міри новизни як функції фітнесу для генетичного алгоритму працює краще, ніж цільова функція фітнесу. Як це можливо?

genetic-algorithms

— rcpinto
джерело

7

Як пояснено у відповіді на це питання AI SE , GA є "задовольняючими", а не "оптимізаторами" і, як правило, не досліджують "віддалені" області пошукового простору. Швидше за все, населення скупчується в регіонах, які є «досить хорошими» відповідно до функцій фітнесу.

На противагу цьому, я вважаю, що думка полягає в тому, що новизна забезпечує певну динамічну форму, прагнучи відштовхувати населення від раніше виявлених районів.

— НіцшеанськийАІ
джерело

6

Пошук новизни вибирає "поведінку роману" за певним доменним визначенням новизни. Наприклад, новинка в області вирішення лабіринту може бути "різницею досліджуваного маршруту". Врешті-решт знайдуться мережі, які проходять усі можливі маршрути через лабіринт, і ви зможете вибрати найшвидший. Це спрацювало б набагато краще, ніж наївна "мета", як відстань до мети, що може легко призвести до місцевої оптими, яка ніколи не вирішує лабіринт.

Із відмови від цілей: еволюція через пошук наочності лише (моє наголос):

У пошуках новизни замість вимірювання загального прогресу традиційною цільовою функцією еволюція використовує міру поведінкової новизни, яку називають метрикою новизни. Фактично, пошук, керований такою метрикою, явно виконує те, що природна еволюція робить пасивно, тобто поступово накопичуючи нові форми, що піднімаються по сходах складності.
Наприклад, у двосхилому домені переміщення початкові спроби можуть просто впасти. Показник новизни може винагородити просто падіння іншим способом, незалежно від того, наближається він до об'єктивної поведінки чи ні. На відміну від цього, об'єктивна функція може явно винагороджувати падіння найдальшого, що, швидше за все, не призводить до кінцевої мети ходьби і, таким чином, ілюструє оманливий локальний оптимум. На відміну від цього, у пошуках новизни зберігається набір примірників, які представляють найбільш нові відкриття. Подальший пошук потім стрибає з цих представницьких форм поведінки. Після того, як виявлено кілька способів падіння, єдиний спосіб бути винагородженим - це знайти поведінку, яка не падає одразу . Таким чином складність поведінки підвищується знизу вгору.Врешті-решт, щоб зробити щось нове, двоногий повинен був би успішно пройти деяку відстань, хоча це не є метою .

— мікромізувати
джерело