Я будую модель, і я думаю, що географічне розташування, ймовірно, дуже добре спрогнозує мій цільовий змінний. У мене є поштовий індекс кожного з моїх користувачів. Я не зовсім впевнений, що найкращий спосіб включити поштовий індекс як функцію передбачувача у свою модель. Хоча поштовий індекс - це номер, він нічого не означає, якщо число збільшується або зменшується. Я міг бинарізувати всі 30 000 поштових індексів, а потім включити їх як функції або нові стовпці (наприклад, {user_1: {61822: 1, 62118: 0, 62444: 0 і т.д.}}. Однак, схоже, це додасть би тонну особливостей моєї моделі.
Будь-які думки про найкращий спосіб вирішити цю ситуацію?