Як працюють генеративні змагальні мережі?


12

Я читаю про генеративні змагальні мережі (GAN) і маю певні сумніви щодо цього. Поки я розумію, що в GAN існує два різних типи нейронних мереж: одна - генеративна ( ), а інша - дискримінаційна ( ). Генеративна нейронна мережа генерує деякі дані, які дискримінаційна нейронна мережа оцінює правильність. GAN дізнається, передаючи функцію втрат обом мережам.ГD

Як дискримінаційні ( ) нейронні мережі спочатку знають, чи дані, отримані , правильні чи ні? Чи потрібно спочатку тренувати а потім додавати його до GAN за допомогою ?DГDГ

Розглянемо мою підготовлену сітку , яка може класифікувати зображення з 90% відсотковою точністю. Якщо ми додамо цю мережу до GAN, існує 10% ймовірність, що вона класифікує зображення неправильно. Якщо ми будемо тренувати GAN з цією мережею то чи буде вона мати ті ж 10% помилки при класифікації зображення? Якщо так, то чому GAN показують перспективні результати?DDD

Відповіді:


4

Порівняйте генеровані та реальні дані

Усі результати, отримані G завжди, вважаються "неправильними" за визначенням, навіть для дуже хорошого генератора.

Ви надаєте дискримінаційну нейронну мережу поєднанням результатів, що генеруються генераторною мережею та реальними результатами із зовнішнього джерела, а потім ви навчаєте її розрізняти, чи результат був створений генератором чи ні - ви не порівнюєте " хороші "та" погані "результати, ви порівнюєте реальні та отримані результати.DГ

Це призведе до "взаємної еволюції", оскільки D навчиться знаходити функції, які відокремлюють реальні результати від створених, а Г навчиться генерувати результати, які важко відрізнити від реальних даних.


2

Дискримінаційна мережу ( D ) вчиться на дискримінацію за визначенням - ми забезпечуємо його з істинним і згенерували даними, і нехай це навчитися самостійно , як розрізняти між ними.

DГDD

З огляду на це, використання цього сценарію може бути хорошим "непідвладним" способом поліпшити потужність класифікації нейронних мереж, оскільки це змушує модель генератора вивчати кращі характеристики реальних даних та навчитися розрізняти фактичні особливості та шум, використовуючи набагато менше даних, необхідних для традиційної схеми навчання під контролем.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.