Я намагаюся розробити модель прогнозування, використовуючи великі клінічні дані, включаючи лабораторні значення. Простір даних розрізнений з 5-ти зразками та 200 змінними. Ідея полягає у ранжуванні змінних за допомогою методу вибору функцій (IG, RF тощо) та використання функцій вищого рейтингу для розробки прогнозної моделі.
Хоча вибір можливостей іде добре з підходом Naive Naes Bayes, я зараз зачіпаю проблему в реалізації прогнозної моделі через відсутність даних (NA) у мій змінний простір. Чи існує алгоритм машинного навчання, який може обережно обробляти зразки з відсутніми даними?