Приклади: у мене є речення в описі посади: "Старший інженер Java у Великобританії".
Я хочу використовувати модель глибокого навчання, щоб передбачити її як 2 категорії: English
і IT jobs
. Якщо я використовую традиційну модель класифікації, вона може передбачити лише 1 мітку з softmax
функцією на останньому шарі. Таким чином, я можу використовувати 2 модельні нейронні мережі для прогнозування "Так" / "Ні" для обох категорій, але якщо у нас більше категорій, це занадто дорого. Тож у нас є якась модель поглибленого або машинного навчання, щоб передбачити одночасно 2 чи більше категорій?
"Редагувати": з 3 мітками за традиційним підходом вона буде закодована [1,0,0], але в моєму випадку вона буде закодована [1,1,0] або [1,1,1]
Приклад: якщо у нас є 3 мітки, і речення можуть відповідати всім цим міткам. Отже, якщо вихід з функції softmax дорівнює [0,45, 0,35, 0,2], ми повинні класифікувати його на 3 мітки або 2 мітки, а може бути один? Основна проблема, коли ми це робимо, це: який хороший поріг класифікувати на 1, 2 або 3 мітки?