Це навряд чи набагато перевищить ваші зусилля щодо прямого збору даних.
Якість поточних виходів GAN (станом на 2017 рік) буде недостатньо високою. Зображення, створені GAN, як правило, невеликі і можуть мати незвичайні / неоднозначні деталі та непарні спотворення. У роботі, яку ви пов’язали, зображення, що генеруються системою із речення, мають правдоподібні кольорові блоки з урахуванням теми, але без того, як пропозиція додає вам те, чого очікувати більшості з них, не впізнається як будь-який конкретний предмет.
GAN з менш амбітною метою, ніж генерування зображень із пропозицій (що, незважаючи на мою критику вище, справді чудовий подвиг IMO), повинен створювати ближче до фотореалістичних зображень. Але їх обсяг буде меншим і, ймовірно, не буде включати бажаний тип зображення. Крім того, зазвичай розмір виводу невеликий, наприклад, 64x64 або 128x128 *, і все ще є достатньо спотворень та неоднозначностей, що оригінальні основні фотографії правди були б набагато кращими.
Сама GAN обмежена наявними навчальними бібліотеками - це не буде добре, якщо ви спробуєте генерувати зображення поза межами її даних навчальних даних. Результати, показані в дослідницькому документі, безумовно, зосереджені на домені, наданому навчальними даними. Але ви не можете просто ввести будь-яке речення в цю модель і очікувати результату, який був би корисний в іншому місці.
Якщо ви знайдете GAN, який пройшов навчання на відповідному наборі даних для вашої проблеми, вам, швидше за все, краще спробувати отримати ті самі дані безпосередньо для вашого проекту.
Якщо ви зіткнулися з проблемою з обмеженими даними про основну правду, то, можливо, кращим підходом до використання GAN було б використання попередньо підготовленого класифікатора, такого як VGG-19 або Inception v5, замінення останніх декількох повністю підключених шарів, і штраф налаштуйте його на свої дані. Ось приклад того, як це зробити за допомогою бібліотеки Keras в Python - інші приклади можна знайти за допомогою пошукових запитів на кшталт "тонкої настройки класифікатора зображень CNN".
* З моменту опублікування цієї відповіді, новітні GAN стали кращими. Дослідницька команда Nvidia мала надзвичайний успіх у створенні 1024х1024 фотореалістичних зображень . Однак це не змінює інших моментів моєї відповіді. GAN не є надійним джерелом зображень для завдань класифікації зображень, за винятком, можливо, для підзадач того, з чого GAN вже пройшов навчання та здатний умовно генерувати (а може і більш тривіально) надавати вихідні дані для "інших" категорій у класифікатори).