Чи слід центрирувати дані + масштабувати перед застосуванням t-SNE?


18

Деякі функції моїх даних мають великі значення, а інші мають значно менші значення.

Чи потрібно центрувати + масштабні дані перед застосуванням t-SNE, щоб запобігти зміщенню до великих значень?

Я використовую реалізацію sklern.manifold.TSNE Python із метрикою евклідової відстані за замовчуванням.

Відповіді:


18

Центрирування не має значення, оскільки алгоритм працює лише на відстанях між точками, проте масштабування необхідно, якщо ви хочете, щоб різні розміри розглядалися з однаковою важливістю, оскільки 2-норма буде сильніше впливати на розміри з великою дисперсією.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.