Я хотів би зробити скорочення розмірності на майже 1 мільйон векторів кожних 200 вимірювань ( doc2vec
). Я використовую для цього TSNE
реалізацію з sklearn.manifold
модуля, і головна проблема - складність у часі. Навіть при method = barnes_hut
цьому швидкість обчислення залишається низькою. Деякий час навіть не вистачає пам'яті.
Я працюю на 48-ядерному процесорі зі 130G ОЗУ. Чи є метод запустити його паралельно або скористатися рясним ресурсом, щоб прискорити процес.