Чи чули ви про єдине наближення та проекцію колектора (UMAP) ?
UMAP (Уніфіковане наближення та проекція колекторів) - це нова технологія навчання безлінійного зменшення розмірів. UMAP побудований з теоретичних рамок, заснованих на римановій геометрії та алгебраїчній топології. Результат - практичний масштабований алгоритм, який застосовується до реальних даних. Алгоритм UMAP є конкурентоспроможним t-SNE за якість візуалізації, і, ймовірно, зберігає більшу частину глобальної структури з чудовими показниками часу виконання. Крім того, UMAP, як описано, не має обчислювальних обмежень щодо вбудовування розмірності, що робить його життєздатним як техніку зменшення розмірів загального призначення для машинного навчання.
Перевірте їх код та оригінальний папір на наявність плюсів і мінусів, це дуже просто у використанні.
Швидкі факти: UMAP може працювати з великими наборами даних і швидше, ніж t-SNE, а також підтримує пристосування до розріджених матричних даних, і всупереч t-SNE, загальноприйнятій техніці зменшення розмірів, що означає, що не тільки його можна використовувати для візуалізації, але й для зменшення можливості функціонування для подачі інших моделей машинного навчання.
Конкретні приклади: Я порівняв метод і порівняв його з деякими іншими методами зменшення розмірності тестовим зошитом , якщо зацікавлений у швидкому огляді та старті стрибка.