Я новачок у машинному навчанні та керах, і зараз працюю над класовою проблемою класифікації зображень за допомогою керас. Вхід позначено тегом зображення. Після деякої попередньої обробки дані тренінгу представлені в списку Python як:
[["dog", "path/to/dog/imageX.jpg"],["cat", "path/to/cat/imageX.jpg"], ["bird", "path/to/cat/imageX.jpg"]]
"собака", "кішка" та "птах" - це позначки класу. Я думаю, що для цієї проблеми слід використовувати одне гаряче кодування, але мені не дуже зрозуміло, як боротися з цими рядковими мітками. Я спробував LabelEncoder () sklearn таким чином:
encoder = LabelEncoder()
trafomed_label = encoder.fit_transform(["dog", "cat", "bird"])
print(trafomed_label)
А вихід - [2 1 0], що відрізняється від мого очікування виходу подібного типу [[1,0,0], [0,1,0], [0,0,1]]. Це можна зробити за допомогою кодування, але я хотів би знати, чи існує якийсь "стандартний" або "традиційний" спосіб боротьби з цим?