Відмова від відповідальності: представлений підхід не є можливим для постійних значень, але я вважаю, що він має певну вагу при прийнятті рішень для проекту Smarty77 наводить хороший момент щодо використання масштабованої сигмоїдної функції. За своєю суттю сигмоїдна функція створює ймовірність, яка описує коефіцієнт успішності вибірки (тобто 95 із 100 фотографій із цими ознаками успішно «собачі»). Описаний кінцевий результат є двійковим, і навчання, використовуючи «бінарну перехресну ентропію», описує процес поділу діаметрально протилежних результатів, який по суті відштовхує результати в середньому діапазоні. Континуум виходу є лише для масштабування на основі кількості зразків (тобто результат 0,9761 означає, що 9761 із 10000 зразків, що показують ті чи подібні тріати, є "собакою"), але кожен результат сам по собі все-таки повинен вважатися двійковим, а не довільно детальним. Таким чином, його не слід помиляти і застосовувати, оскільки це реальні цифри, і тут вони не можуть бути застосовані. Хоча я не впевнений у використанні мережі, я б нормалізував вихідний вектор wrt сам. Це можна зробити за допомогою softmax. Для цього також знадобиться 11 лінійних виходів (бункерів) з мережі (по одному на кожен вихід -5 до +5), по одному для кожного класу. Це дасть значення впевненості, що будь-який "смітник" є правильною відповіддю. Цю архітектуру можна було б відстежувати за допомогою гарячого кодування, при цьому 1 вказує правильний бункер. Результат інтерпретується потім таким чином, як жадібна стратегія чи ймовірнісний вибір. Однак, щоб переробити її на суцільну змінну, впевненість кожного індексу може бути використана як вага для розміщення маркера на рядковій лінії (аналогічно поведінці сигмоподібної одиниці), але це також підкреслює основне питання: якщо мережа досить впевнена, результат -2 або +3, але абсолютно впевнений, що це не інше, чи є +1 життєздатним результатом? Спасибі за вашу увагу. Удачі у вашому проекті.