VAE - це рамка, яка була запропонована як масштабований спосіб робити варіаційний ЕМ (або варіаційний висновок взагалі) на великих наборах даних. Хоча має структуру, схожу на AE, вона служить набагато більшій цілі.
Сказавши це, можна, звичайно, використовувати VAE для вивчення прихованих уявлень. Відомо, що VAE дають уявлення з відстороненими факторами [1] Це відбувається через ізотропні гауссові пріори на прихованих змінних. Моделювання їх як гауссів дозволяє кожному виміру в представленні просунути себе якомога далі від інших факторів. Також [1] додав коефіцієнт регуляризації, який контролює вплив попереднього.
Хоча ізотропних гасівців достатньо для більшості випадків, для конкретних випадків, можливо, хочеться моделювати апріори по-іншому. Наприклад, у випадку послідовностей можна визначити пріори як послідовні моделі [2].
Повертаючись до питання, як видно, попереднє дає суттєвий контроль над тим, як ми хочемо моделювати наш прихований розподіл. Такого роду контроль не існує у звичайних рамках АЕ. Це насправді сила самих байесівських моделей, VAE просто роблять це більш практичним і можливим для масштабних наборів даних. Отже, підсумовуючи, якщо ви хочете точного контролю над своїми прихованими уявленнями та тим, що ви хотіли б, щоб вони представляли, тоді виберіть VAE. Іноді точне моделювання може зафіксувати кращі уявлення, як у [2]. Однак якщо AE вистачає на роботу, яку ви виконуєте, то просто зайдіть з AE, це досить просто і непросто. Зрештою, з AE ми просто робимо нелінійний PCA.
[1] Рання візуальна концепція навчання з непідконтрольним глибоким навчанням, 2016
Ірина Хіггінс, Лоїк Метті, Ксав'є Глоро, Арка Пал, Беніньо Урія, Чарльз Блонделл, Шакір Мохамед, Олександр Лерхнер
https://arxiv.org/abs/1606.05579
[2] Повторна модель латентної змінної для послідовних даних, 2015 р.
Джунюнг Чунг, Кайл Кастнер, Лоран Дінь, Кратарт Гоел, Аарон Курвіль, Йошуа Бенджо
https://arxiv.org/abs/1506.02216