Вибачає за нецільове використання технічних термінів. Я працюю над проектом семантичної сегментації за допомогою конволюційних нейронних мереж (CNN); намагаючись реалізувати архітектуру типу Encoder-Decoder, тому вихід має той же розмір, що і вхідний.
Як ви проектуєте етикетки? Яку функцію втрат слід застосувати? Особливо в умовах важкої нерівноваги класу (але співвідношення між класами змінюється від зображення до зображення).
Проблема стосується двох класів (об'єкти, що цікавлять та передумови). Я використовую Керас із тензорфлоу-серцем.
Поки я збираюся розробити очікувані виходи таких самих розмірів, як і вхідні зображення, застосовуючи піксельне маркування. Заключний рівень моделі має або активацію softmax (для 2 класу), або сигмоїдну активацію (для вираження ймовірності того, що пікселі належать до класу об'єктів). У мене виникають проблеми з розробкою підходящої цільової функції для такого завдання типу:
function(y_pred,y_true)
,
за погодженням з Керасом .
Будь ласка, спробуйте бути конкретними з розмірами залучених тензорів (вхід / вихід моделі). Будь-які думки та пропозиції дуже вдячні. Дякую !