У мене створена нейронна мережа, щоб передбачити щось, де вихідна змінна є порядковою. Я опишу нижче, використовуючи три можливі виходи A <B <C.
Цілком очевидно, як використовувати нейронну мережу для виведення категоричних даних: вихід - це лише програмна макс останнього (зазвичай повністю підключеного) шару, по одному на категорію, а передбачувана категорія - сама з найбільшим вихідним значенням (це за замовчуванням у багатьох популярних моделях). Я використовував те саме налаштування для порядкових значень. Однак у цьому випадку виходи часто не мають сенсу, наприклад, мережеві виходи для A і C високі, але B низькі: це не правдоподібно для порядкових значень.
У мене є одна ідея для цього, яка полягає в обчисленні втрат на основі порівняння виходів з 1 0 0 для A, 1 1 0 для B і 1 1 1 для C. Точні пороги можна настроїти пізніше, використовуючи інший класифікатор (наприклад, Bayesian ), але це, здається, охоплює суттєву ідею впорядкування входів, не прописуючи жодної конкретної інтервальної шкали.
Який стандартний спосіб вирішення цієї проблеми? Чи є дослідження чи посилання, які описують плюси та мінуси різних підходів?