У мене є проблема класифікації як категоричних, так і числових даних. Проблема, з якою я стикаюся, полягає в тому, що мої категоричні дані не виправлені, це означає, що новий кандидат, ярлик якого я хочу передбачити, може мати нову категорію, яку раніше не спостерігали.
Наприклад, якщо мої категоричні дані були sex
єдино можливими етикетки не було б female
, male
і other
, незалежно від того , що. Однак моя категорична змінна city
така, що може статися так, що людина, яку я намагаюся передбачити, має нове місто, якого мій класифікатор ніколи не бачив.
Мені цікаво, чи є спосіб зробити класифікацію за цими термінами чи мені слід провести навчання ще раз, враховуючи ці нові категоричні дані.
city
на число на основі якоїсь функції? Якcity' = f(latitude, longitude)
таким чином, ви можете створити нове значення для будь-якого міста