Чим корисно використовувати t-SNE, крім візуалізації даних?


12

У яких ситуаціях слід використовувати t-SNE (крім візуалізації даних)?

T-SNE використовується для зменшення розмірності. Відповідь на це запитання говорить про те, що t-SNE слід використовувати лише для візуалізації, і ми не повинні використовувати його для кластеризації. Тоді яке корисне використання для t-SNE?


6
Стандартна порада - НЕ використовувати tsne для кластеризації, оскільки кластери так залежать від здивування. Він повинен використовуватися лише для "візуалізації". Але це не дуже зрозуміло для мене, оскільки тут же шукають (і бачать) кластери, дивлячись на сюжет цне. Тому ваше питання є гарним: для чого це tne?
generic_user

2
Дивіться відповідь на це запитання, яке я задав: stats.stackexchange.com/questions/263539/…
generic_user

як сказав @generic_user, я хочу знати перевагу t-sne, крім його візуалізації.
Вулф

Я не знаю, чому це було закрито як дублікат. ОП запитує, які корисні можливості t-sne окрім візуалізації. Зв'язана нитка - це все про кластеризацію. Але можуть бути й інші способи використання.
амеба

Відповіді:


4

Відповідь на це запитання говорить про те, що t-SNE слід використовувати лише для візуалізації, і ми не повинні використовувати його для кластеризації. Тоді яке корисне використання для t-SNE?

Я не згоден з цим висновком. Немає підстав вважати, що t-SNE є гіршим універсальним, ніж будь-який інший алгоритм кластеризації. Кожен алгоритм кластеризації передбачає припущення щодо структури даних, і від них можна очікувати, що вони будуть виконуватись по-різному, залежно від базового розподілу та кінцевого використання зменшеної розмірності.

t-SNE, як і багато непідконтрольних алгоритмам навчання, часто дають можливість досягти мети, наприклад, отримати раннє уявлення про те, чи є дані відокремлювані чи ні, перевіряючи, чи має вона якусь ідентифіковану структуру, та перевіряючи природу цієї структури. Не потрібно візуалізації виходу t-SNE, щоб почати відповідати на деякі з цих питань. Інші програми вбудовування менших розмірів включають функції побудови для класифікації або позбавлення від мультиколінеарності для підвищення ефективності методів прогнозування.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.