У мене є проблема класифікації як категоричних, так і числових даних. Проблема, з якою я стикаюся, полягає в тому, що мої категоричні дані не виправлені, це означає, що новий кандидат, ярлик якого я хочу передбачити, може мати нову категорію, яку раніше не спостерігали.
Наприклад, якщо мої категоричні дані були sexєдино можливими етикетки не було б female, maleі other, незалежно від того , що. Однак моя категорична змінна cityтака, що може статися так, що людина, яку я намагаюся передбачити, має нове місто, якого мій класифікатор ніколи не бачив.
Мені цікаво, чи є спосіб зробити класифікацію за цими термінами чи мені слід провести навчання ще раз, враховуючи ці нові категоричні дані.
cityна число на основі якоїсь функції? Якcity' = f(latitude, longitude)таким чином, ви можете створити нове значення для будь-якого міста