Привіт, є кадр даних з великими категоричними значеннями понад 1600 категорій, чи є спосіб знайти альтернативи, щоб у мене не було понад 1600 стовпців.
Я знайшов це нижче за цікавим посиланням http://amunategui.github.io/feature-hashing/#sourcecode
Але вони перетворюються на клас / об’єкт, якого я не хочу. Я хочу, щоб мій кінцевий результат був у якості фрейму даних, щоб я міг перевірити різні моделі машинного навчання? або чи я можу використати генеровану матрицю для навчання інших моделей машинного навчання, окрім логістичної регресії чи XGBoost?
Чи все-таки я можу реалізувати?