Запитання з тегом «feature-scaling»

3
Функція Трансформація у вхідних даних
Я читав про рішення цього виклику OTTO Kaggle, і на першому місці рішення, здається, використовує кілька перетворень для вхідних даних X, наприклад Log (X + 1), sqrt (X + 3/8) тощо. Чи є загальне керівництво щодо того, коли слід застосовувати перетворення якого типу до різних класифікаторів? Я розумію поняття середньої …

3
Який хороший спосіб перетворити циклічні звичайні атрибути?
У мене є атрибут поля "година", але воно приймає циклічні значення. Як я міг перетворити функцію, щоб зберегти інформацію, наприклад "23" та "0" години, недалеко. Один із способів, що я можу подумати, - це зробити трансформацію: min(h, 23-h) Input: [0 1 2 3 4 5 6 7 8 9 10 …

1
Чи слід масштабувати один гарячий вектор числовими атрибутами
У випадку поєднання категоричних та числових атрибутів я зазвичай перетворюю категоричні атрибути в один гарячий вектор. Моє запитання: чи залишаю я ці вектори такими, які є, і масштабувати числові атрибути шляхом стандартизації / нормалізації, або я повинен масштабувати один гарячий вектор разом із числовими атрибутами?

1
Способи вирішення функції довготи / широти [закрито]
Закрито . Це питання потребує деталей або ясності . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Додайте деталі та уточніть проблему, відредагувавши цю публікацію . Закрито 3 роки тому . Я працюю над вигаданим набором даних з 25 функціями. Дві особливості - це широта та довгота місця, а інші …

3
Чому ми перетворюємо перекошені дані в звичайний розподіл
Я переглядав рішення конкурсу цін на житло на Kaggle (Ядерний аналог людини на ціни на житло : Техніка попередньої регресії ) і натрапив на цю частину: # Transform the skewed numeric features by taking log(feature + 1). # This will make the features more normal. from scipy.stats import skew skewed …

4
Як масштабувати масив підписаних цілих чисел для діапазону від 0 до 1?
Я використовую Brain для тренування нейронної мережі на наборі функцій, що включає як позитивні, так і негативні значення. Але для мозку потрібні вхідні значення від 0 до 1. Який найкращий спосіб нормалізувати мої дані?

2
Наслідок масштабування функцій
Наразі я використовую SVM і масштабую свої функції тренувань до [0,1]. Я спочатку підходять / трансформують свій навчальний набір, а потім застосовують те саме перетворення до мого тестового набору. Наприклад: ### Configure transformation and apply to training set min_max_scaler = MinMaxScaler(feature_range=(0, 1)) X_train = min_max_scaler.fit_transform(X_train) ### Perform transformation on testing …

2
Лінійна регресія та масштабування даних
Наступний графік показує коефіцієнти, отримані при лінійній регресії (з mpgцільовою змінною та всі інші як предиктори). Для набору даних mtcars ( тут і тут ) як із масштабуванням даних, так і без них: Як я інтерпретую ці результати? Змінні hpта dispзначущі лише в тому випадку, якщо дані масштабуються. Це amі …

3
Нульова середня та одинична варіація
Я вивчаю масштабування даних і, зокрема, метод стандартизації. Я зрозумів математику за цим, але мені незрозуміло, чому важливо наводити функції нульової середньої та одиничної дисперсії. Ви можете мені пояснити?
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.