Припустимо, я хочу вивчити класифікатор, який приймає вектор чисел як вхідний і дає мітку класу як вихід. Мої дані навчання складаються з великої кількості пар вхід-вихід.
Однак, коли я приходжу до тестування деяких нових даних, ці дані, як правило, лише частково завершені. Наприклад, якщо вектор вводу має довжину 100, лише 30 елементам можуть бути задані значення, а решта - "невідомі".
Як приклад цього розглянемо розпізнавання зображень там, де відомо, що частина зображення оклюдирована. Або розглянемо класифікацію в загальному розумінні, коли відомо, що частина даних є пошкодженою. У всіх випадках я точно знаю, які елементи у векторі даних є невідомими частинами.
Мені цікаво, як я можу дізнатися класифікатор, який би працював для такого роду даних? Я міг би просто встановити "невідомі" елементи на випадкове число, але враховуючи, що часто є більше невідомих елементів, ніж відомі, це не здається гарним рішенням. Або я можу випадковим чином змінити елементи навчальних даних на "невідомі" і тренувати ці, а не повні дані, але це може зажадати вичерпного вибірки всіх комбінацій відомих і невідомих елементів.
Зокрема, я думаю про нейронні мережі, але я відкритий для інших класифікаторів.
Будь-які ідеї? Дякую!