Наразі я використовую SVM і масштабую свої функції тренувань до [0,1]. Я спочатку підходять / трансформують свій навчальний набір, а потім застосовують те саме перетворення до мого тестового набору. Наприклад:
### Configure transformation and apply to training set
min_max_scaler = MinMaxScaler(feature_range=(0, 1))
X_train = min_max_scaler.fit_transform(X_train)
### Perform transformation on testing set
X_test = min_max_scaler.transform(X_test)
Припустимо, що дана особливість у навчальному наборі має діапазон [0,100], а ця сама особливість у тестовому наборі має діапазон [-10,120]. У навчальному наборі ця функція буде відповідним чином масштабована до [0,1], тоді як у тестовому наборі ця функція буде масштабуватися до діапазону, що не відповідає першому зазначеному, щось на зразок [-0.1,1.2].
Мені було цікаво, які наслідки особливостей тестового набору виходять за межі тих, що використовуються для тренування моделі? Це проблема?