Я не знаю, чи це звичайна / найкраща практика, але це інша точка зору.
Якщо у вас, скажімо, дата, ви можете розглядати кожне поле як "змінну категорії", а не "суцільну змінну". День мав би значення в наборі {1, 2 ..., 31}, місяць матиме значення у {1, ..., 12}, і за рік ви вибираєте мінімальне та максимальне значення і побудувати набір.
Тоді, оскільки конкретні числові значення днів, місяців та років можуть бути не корисними для пошуку тенденцій в даних, використовуйте двійкове представлення для кодування числових значень, будучи кожним бітом ознакою. Наприклад, 5-й місяць буде 0 0 0 0 1 0 0 0 0 0 0 0
(11 0 - це позиція 1 на 5-му місці, кожен біт - функція).
Так, маючи, наприклад, 10 років у "наборі року", дата буде перетворена на вектор із 43 ознак (= 31 + 12 + 10). Використовуючи "розріджені вектори", кількість функцій не повинна бути проблемою.
Щось подібне можна зробити для даних про час, день тижня, день місяця ...
Все залежить від питання, на яке ви хочете відповісти від вашої моделі машинного навчання.