Запитання з тегом «tsne»

T-розподілене стохастичне вбудовування сусідів (t-SNE) - це нелінійний алгоритм зменшення розмірності, запроваджений ван дер Маатеном та Гінтоном у 2008 році.

6
Кластеризація на виході t-SNE
У мене є додаток, де було б зручно кластерувати шумний набір даних, перш ніж шукати ефекти підгруп у кластерах. Я спершу подивився на PCA, але для отримання 90% варіабельності потрібно ~ 30 компонентів, тому кластеризація лише на декількох комп'ютерах викине багато інформації. Потім я спробував t-SNE (вперше), який надає мені …

3
Чи бувають випадки, коли PCA більше підходить, ніж t-SNE?
Хочу побачити, як 7 заходів поведінки на коригування тексту (час, витрачений на коригування тексту, кількість натискань клавіш тощо) стосуються один одного. Заходи співвідносні. Я провів PCA, щоб побачити, як заходи проектуються на PC1 та PC2, що дозволяє уникнути перекриття виконання окремих двосторонніх кореляційних тестів між заходами. Мене запитали, чому б …
39 pca  tsne 

1
Чому ми використовуємо дивергенцію Куллбека-Лейблера, а не перехресну ентропію в цільовій функції t-SNE?
На мій погляд, розбіжність KL від розподілу вибірки до справжнього розподілу - це просто різниця між перехресною ентропією та ентропією. Чому ми використовуємо перехресну ентропію як функцію витрат у багатьох моделях машинного навчання, а використовуємо дивергенцію Kullback-Leibler в t-sne? Чи є різниця в швидкості навчання?

2
Коли t-SNE вводить в оману?
Цитуючи одного з авторів: t-Розподілене стохастичне сусідське вбудовування (t-SNE) - це ( виграшний ) метод зменшення розмірності, який особливо добре підходить для візуалізації високомірних наборів даних. Так це звучить досить чудово, але це той, хто говорить Автору. Ще одна цитата автора (ре: вищезгаданий конкурс): Що ви зняли з цього змагання? …

3
Чому t-SNE не використовується як метод зменшення розмірності для кластеризації чи класифікації?
У недавньому призначенні нам сказали використовувати PCA на цифрах MNIST, щоб зменшити розміри з 64 (8 x 8 зображень) до 2. Потім нам довелося кластеризувати цифри за допомогою Гауссової моделі суміші. PCA, що використовує лише 2 основних компоненти, не дає чітких кластерів, і в результаті модель не в змозі створити …

4
Що не так з t-SNE проти PCA для зменшення розмірів за допомогою R?
У мене є матриця з цифрами з плаваючою точкою 336x256 (336 бактеріальних геномів (стовпців) х 256 нормалізованих частот тетрануклеотидів (рядки), наприклад, кожен стовпець додає до 1). Я отримую хороші результати, коли запускаю свій аналіз, використовуючи принцип компонентного аналізу. Спочатку я обчислюю кластери kmeans за даними, потім запускаю PCA та розфарбовую …
27 r  pca  tsne 

3
Чи слід вважати зменшення розмірності для візуалізації «закритою» проблемою, вирішеною t-SNE?
Я багато читав про алгоритм -sneтtt для зменшення розмірності. Я дуже вражений роботою на "класичних" наборах даних, як-от MNIST, де вона чітко розмежовує цифри ( див. Оригінальну статтю ): Я також використовував це для візуалізації функцій, засвоєних нейронною мережею, яку я навчаю, і я був дуже задоволений результатами. Отже, наскільки …

1
t-SNE проти MDS
Останнім часом читав кілька запитань щодо t-SNE ( t-Distributed Stochastic Neighbor Embedding ), а також відвідав декілька питань щодо MDS ( багатовимірного масштабування ). Вони часто використовуються аналогічно, тому здавалося, що непогано змусити це запитання, побачивши, що тут є багато питань як щодо, так і окремо (або порівняно з PCA …

5
Чи є версії t-SNE для потокового передавання даних?
Моє розуміння t-SNE та наближення Барнса-Хата полягає в тому, що потрібні всі точки даних, щоб можна було обчислити всі силові взаємодії одночасно, і кожну точку можна відрегулювати на 2d (або нижній розмірній) карті. Чи існують версії t-sne, які можуть ефективно справлятися з потоковими даними? Тож якщо мої спостереження надходять одне …

1
Чи слід центрирувати дані + масштабувати перед застосуванням t-SNE?
Деякі функції моїх даних мають великі значення, а інші мають значно менші значення. Чи потрібно центрувати + масштабні дані перед застосуванням t-SNE, щоб запобігти зміщенню до великих значень? Я використовую реалізацію sklern.manifold.TSNE Python із метрикою евклідової відстані за замовчуванням.

3
Вибір гіперпараметрів з використанням T-SNE для класифікації
В якості специфічної проблеми, з якою я працюю (конкуренція), у мене є наступне налаштування: 21 функція (числовий на [0,1]) та двійковий вихід. У мене близько 100 К рядків. Налаштування здається дуже галасливим. Я та інші учасники впродовж певного часу застосовуємо генерацію функцій, і вбудована стохастична сусідська вбудована версія t виявилася …

1
Яке значення осей у t-SNE?
Зараз я намагаюся обернути голову навколо математики t-SNE . На жаль, є ще одне питання, на яке я не можу відповісти задовільно: Яке власне значення осей у графіку t-SNE? Якби я виступив з доповіддю на цю тему або включив її до будь-якої публікації: Як би я належним чином позначив осі? …

1
Який алгоритм класифікації слід використовувати, побачивши, що t-SNE добре розділяє класи?
Припустимо, у нас є проблема класифікації, і спочатку ми хочемо отримати деяке розуміння даних і ми робимо t-SNE. Результат t-SNE дуже добре розділяє класи. Це означає, що можна побудувати класифікаційну модель, яка також буде дуже добре розділяти класи (якщо t-SNE не відокремлюється добре, то це не означає багато). Знаючи, що …

1
Чим корисно використовувати t-SNE, крім візуалізації даних?
У яких ситуаціях слід використовувати t-SNE (крім візуалізації даних)? T-SNE використовується для зменшення розмірності. Відповідь на це запитання говорить про те, що t-SNE слід використовувати лише для візуалізації, і ми не повинні використовувати його для кластеризації. Тоді яке корисне використання для t-SNE?


Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.