У яких реалізаціях необхідні масштабування змінних (функціональних) дерев рішень та нормалізація змінної (функції), в яких реалізаціях?


10

У багатьох алгоритмах машинного навчання масштабування функцій (так само змінне масштабування, нормалізація) є поширеним попереднім етапом Вікіпедії - Масштабування функцій - це питання було закритим Питання № 41704 - Як і чому працюють нормалізація та масштабування функцій?

У мене є два питання, зокрема, щодо дерев рішень:

  1. Чи є реалізація дерева рішень, яка потребувала б масштабування функцій? Мені здається, що критерії розщеплення алгоритмів байдужі до масштабу.
  2. Розглянемо ці змінні: (1) Одиниці, (2) Години, (3) Одиниці на годину - найкраще залишити ці три змінні "як є", коли вони подаються в дерево рішень чи ми стикаємося з яким-небудь типом конфлікту оскільки "нормалізована" змінна (3) відноситься до (1) і (2)? Тобто, ви б атакували цю ситуацію, кидаючи всі три змінні в суміш, або ви б зазвичай вибрали якусь комбінацію з трьох або просто використали б "нормалізовану / стандартизовану" функцію (3)?

Відповіді:


6

Для 1 дерева рішень взагалі зазвичай не потребують масштабування. Однак це допомагає у візуалізації / маніпулюванні даними та може бути корисним, якщо ви маєте намір порівняти продуктивність з іншими даними або іншими методами, такими як SVM.

Для 2 це питання налаштування. Одиниці / година можуть вважатися типом змінної взаємодії і можуть мати передбачувану силу, відмінну від кожної окремо. Однак це дійсно залежить від ваших даних. Я б спробував і без, щоб побачити, чи є різниця.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.