Спочатку коротка відповідь, а потім більш тривалий коментар:
Відповідь
Методи SNE обчислюють матрицю подібності N × N як у вихідному просторі даних, так і в низькомірному просторі вбудовування таким чином, що подібність утворює розподіл ймовірності по парам об'єктів. Зокрема, ймовірності, як правило, задаються нормалізованим ядром Гаусса, обчисленим з вхідних даних або з вбудовування. З точки зору класифікації, це відразу ж враховує методи навчання на основі екземплярів . Ви перерахували одну з них: SVM з RBF, а @amoeba вказав kNN. Є також радіальні базові функціональні мережі , в яких я не є експертом.
Прокоментуйте
Сказавши це, я би вдвічі обережніше робив висновки на наборі даних, просто дивлячись на графіки t-SNE. t-SNE не обов'язково зосереджується на локальній структурі. Однак ви можете налаштувати це, налаштувавши perplexity
параметр, який регулює (слабко), як збалансувати увагу між локальними та глобальними аспектами ваших даних.
У цьому контексті perplexity
сама по собі є ударом у темряві про те, скільки близьких сусідів може мати кожне спостереження та надається користувачем. У первинному документі зазначено: "Продуктивність t-SNE є досить сильною щодо змін у здивуванні, а типові значення - від 5 до 50". Однак мій досвід полягає в тому, що отримати максимум від t-SNE може означати аналіз декількох сюжетів з різними неприємностями.
Іншими словами, налаштування learning rate
і perplexity
, можна отримати дуже різні виглядаючі 2-д графіки для однакової кількості навчальних кроків та використання одних і тих же даних.
У цьому документі " Дистиля" Як ефективно використовувати t-SNE, ви знайдете великий підсумок загальних підступних проблем t-SNE-аналізу. Підсумкові бали:
Ці гіперпараметри (наприклад, рівень навчання, здивування) дійсно мають значення
Розміри кластерів у графіку t-SNE нічого не означають
Відстань між кластерами може нічого не означати
Випадковий шум не завжди виглядає випадковим.
Іноді можна побачити деякі фігури
Для топології вам може знадобитися кілька сюжетів
Зокрема, з пунктів 2, 3 та 6 вище, я б подумав двічі, щоб зробити висновки про відокремленість даних, переглядаючи окремі графіки t-SNE. Є багато випадків, коли ви можете «виготовити» сюжети, які показують чіткі кластери, використовуючи правильні параметри.