Чому софтмакс використовується для представлення розподілу ймовірностей?


10

У машинній літературі для вивчення розподілу ймовірностей часто використовується функція softmax. Чи є для цього причина? Чому не використовується інша функція?

Відповіді:


7

З точки зору оптимізації, він має деякі приємні властивості з точки зору диференційованості. Для багатьох проблем з машинним навчанням добре підходить для класифікації 1-з-N.

З точки зору глибокого навчання: Можна також стверджувати, що теоретично використання глибокої мережі з класифікатором softmax зверху може представляти будь-яку функцію ймовірності N класу над простором функцій, оскільки MLP мають властивість універсального наближення .


1
Отже, основна причина популярності Softmax - це приємні властивості диференціювання, які корисні в навчальному середовищі на основі градієнтів. Це все, правда?
ШАШАНК ГУПТА

Так, на мою думку, все одно. Softmax - простий з приємними похідними та привабливий для градієнтного навчання. Погодьтеся з усім, що ви сказали.
Інді АІ

Ви можете вважати softmax функцією ймовірності маси / густини функції, яку ви оптимізуєте. На мою думку, софтмакс - це просто зручний спосіб моделювання функції ймовірності маси / щільності.
Чарльз Чоу

3

Softmax - це також узагальнення логістичної сигмоїдної функції, і тому вона має властивості сигмоїди, такі як легкість диференціювання та знаходження в інтервалі 0-1. Вихід логістичної сигмоїдної функції також знаходиться між 0 і 1, тому, природно, підходящий вибір для представлення ймовірності. Його похідна також перебільшується з точки зору власного випуску. Однак якщо у вашої функції є векторний вихід, вам потрібно скористатися функцією Softmax, щоб отримати розподіл ймовірностей над вихідним вектором. Є деякі інші переваги використання Softmax, про які згадував Indie AI, хоча це не обов'язково має нічого спільного з теорією універсального наближення, оскільки Softmax не є функцією, що використовується лише для нейронних мереж.

Список літератури

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.