Припустимо, я хочу зробити бінарну класифікацію (щось належить до класу A або класу B). Є кілька можливостей зробити це у вихідному шарі нейронної мережі:
Використовуйте 1 вихідний вузол. Вихід 0 (<0,5) вважається класом A, а 1 (> = 0,5) вважається класом B (у випадку сигмоїдної)
Використовуйте 2 вихідних вузла. Вхід належить до класу вузла з найвищим значенням / ймовірністю (argmax).
Чи є написані документи, які (також) обговорюють це? Які конкретні ключові слова слід шукати?
Це питання вже задається на цьому сайті, наприклад, дивіться це посилання без реальних відповідей. Мені потрібно зробити вибір (магістерська робота), тому я хочу отримати уявлення про плюси / мінуси / обмеження кожного рішення.