Маючи справу з потоковими даними, можливо, вам не потрібно / потрібно вставляти всі точки історії в одну карту t-SNE. В якості альтернативи ви можете виконати вбудовування в Інтернет , виконавши наступні прості дії:
виберіть вікно часу тривалістю T, достатньо тривалим, щоб кожен цікавий малюнок відображався принаймні пару разів протягом тривалості вікна.
прокрутіть вікно, коли потоки даних пройдуть, з тимчасовим кроком dt, значно меншим за T. Для кожного положення вікна обчисліть вбудовування t-SNE даних точок даних у часове вікно.
насіньте кожне вбудовування з результатом попереднього. У t-SNE потрібно вибрати початкові координати точок даних у низькомірному просторі. У нашому випадку, оскільки ми вибираємо dt набагато менший за T, два послідовних вбудовування поділяють більшість своїх точок даних. Для всіх точок спільного використання даних порівняйте їх початкові координати в теперішньому вкладенні до їх кінцевих координат у попередньому вбудовуванні . Цей крок забезпечить послідовне представлення подібних зразків у послідовних вкладках. (у реалізації sklearn у python параметр set є "init". За замовчуванням реалізація sklearn встановлює початкове положення точок випадковим чином)
Примітка 1: Важливо, щоб інтерес-моделі відображалися хоча б один раз у будь-який часовий період часу, щоб пам'ять представництва не загубилася, коли вікно ковзає через набір даних. Дійсно, t-SNE, як правило, не сходить до унікального рішення, а лише до локального мінімуму, тому, якщо пам'ять втрачена, подібний малюнок може бути представлений дуже різними способами у двох моментах вбудовування.
Примітка 2: Цей метод особливо актуальний при роботі з нестаціонарними часовими рядами, де хочеться відстежувати закономірності, що повільно розвиваються в часі. Дійсно, кожне вбудовування тут пристосоване спеціально до невеликого часового вікна, на яке воно обчислюється, гарантуючи, що воно найкращим чином фіксує тимчасово локальну структуру (на відміну від повного вбудовування всього нестаціонарного набору даних).
Примітка 3: У цьому методі послідовне вбудовування не може бути паралельним, оскільки потрібен результат попереднього вбудовування, щоб викласти наступне. Однак, оскільки насіння (тобто початкові координати точок) добре вибрано для більшості точок (усі спільні точки між послідовними вкладками), вбудовування, як правило, конвергується дуже швидко, лише за кілька ітерацій.
Для прикладу застосування цього методу до нестаціонарних часових рядів дивіться цю статтю ( ICLR 2016, Навчання стабільним уявленням у світі, що змінюється, за допомогою он-лайн t-SNE: доказ концепції в пісенній пташці ), де він був успішно застосований відслідковувати появу складів у процесі розвитку в пісенній пташці.