Пропонована вами функція має сингулярність, коли сума елементів дорівнює нулю.
Припустимо, ваш вектор . Цей вектор має суму 0, тому поділ не визначено. Тут функція не відрізняється.[ - 1 , 13, 23]
Крім того, якщо один або декілька елементів вектора негативні, але сума ненульова, ваш результат не є ймовірним.
Припустимо, ваш вектор дорівнює . Він має суму 1, тому застосування вашої функції призводить до , що не є вірогідністю вектора, оскільки в ньому є негативні елементи та елементи, що перевищують 1.[ - 1 , 0 , 2 ][ - 1 , 0 , 2 ]
Розглядаючи ширший погляд, ми можемо мотивувати конкретну форму функції softmax з точки зору розширення бінарної логістичної регресії до випадку трьох чи більше категоричних результатів.
Виконувати такі речі, як взяття абсолютних значень або квадратів, як це пропонується в коментарях, означає, що і мають однакову передбачувану ймовірність; це означає, що модель не визначена . Навпаки, є монотонним і позитивним для всіх дійсних , тому результатом softmax є (1) вектор вірогідності та (2) мультиноміальна логістична модель.- ххexp ( x ) xдосвід( х )х