Назвіть методи, якими алгоритми навчання дерев рішень використовують для боротьби з відсутніми значеннями.
Чи просто вони заповнюють слот, використовуючи значення, яке називається відсутнім?
Спасибі.
Назвіть методи, якими алгоритми навчання дерев рішень використовують для боротьби з відсутніми значеннями.
Чи просто вони заповнюють слот, використовуючи значення, яке називається відсутнім?
Спасибі.
Відповіді:
Існує кілька методів, які використовуються різними деревами рішень. Просто ігнорування відсутніх значень (наприклад, ID3 та інших старих алгоритмів) або трактування пропущених значень як іншої категорії (у випадку номінальної функції) не є реальною обробкою пропущених значень. Однак ці підходи використовувались на ранніх стадіях розробки дерева рішень.
Реальні підходи до обробки відсутніх даних не використовують точку даних з пропущеними значеннями при оцінці розбиття. Однак, коли дочірні вузли створюються та навчаються, ці екземпляри розподіляються якимось чином.
Мені відомо про наступні підходи до розподілу відсутніх екземплярів значення серед дочірніх вузлів: