KL Втрата з одиницею Гаусса


10

Я впроваджував VAE і помітив в Інтернеті дві різні реалізації спрощеної універсальної гауссової дивергенції KL. Оригінальна розбіжність, як тут, є

КLлосс=журнал(σ2σ1)+σ12+(мк1-мк2)22σ22-12
Якщо припустити, що наша попередня - це одиниця гаусса, тобто мк2=0 і σ2=1, це спрощує вниз до
КLлосс=-журнал(σ1)+σ12+мк122-12
КLлосс=-12(2журнал(σ1)-σ12-мк12+1)
І ось тут спочиває моя розгубленість. Хоча я знайшов кілька незрозумілих репозитів github з вищезазначеною реалізацією, але я, як правило, використовую:

=-12(журнал(σ1)-σ1-мк12+1)
Наприклад, в офіційному навчальному посібнику щодо автокодування Keras . Моє запитання тоді, що мені не вистачає між цими двома? Основна відмінність - це скидання коефіцієнта 2 на термін журналу та не зіставлення дисперсії. Аналітично я використовував останнє з успіхом, для чого його варті. Заздалегідь дякую за будь-яку допомогу!

Відповіді:


7

Зауважте, замінивши σ1 з σ12 в останньому рівнянні ви відновлюєте попереднє (тобто журнал(σ1)-σ12журнал(σ1)-σ12). Наводить мене на думку, що в першому випадку кодер використовується для передбачення дисперсії, тоді як у другому він використовується для прогнозування стандартного відхилення.

Обидві рецептури рівноцінні, а мета не змінюється.


Я не думаю, що це може бути рівнозначним. Так, вони обоє мінімізовані за нульмк і одиниця σ. Однак у вихідному рівнянні (із дисперсією) штраф за переміщенняσвід єднання набагато більше, ніж у другому рівнянні (на основі стандартного відхилення). Штраф за варіації вмк однакова для обох, і помилка відновлення була б однаковою, тому використання другої версії різко змінює відносну важливість відхилень σвід єдності. Що я пропускаю?
TheBamf

0

Я вважаю, що відповідь простіша. У VAE люди зазвичай використовують багатоваріантний нормальний розподіл, який має коваріаційну матрицюΣ замість дисперсії σ2. Це виглядає заплутано в фрагменті коду, але має бажану форму.

Тут можна знайти виведення дивергенції KL для багатоваріантних нормальних розподілів: Виведення втрат дивергенції KL для VAE

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.