Мій набір даних складається з векторних послідовностей. Кожен вектор має 50 дійсних значень. Кількість векторів у послідовності становить від 3-5 до 10-15. Іншими словами, довжина послідовності не фіксована.
Деяка значна кількість послідовностей (а не векторів!) Зазначається міткою класу. Моє завдання - вивчити класифікатор, який задає послідовність векторів, обчислює мітку класу для всієї послідовності.
Я не можу сказати точну природу даних, але природа послідовностей не є часовою. Тим не менш, вектор не може бути змінений з вектором без зміни мітки ( ). Іншими словами, порядок векторів важливий. Самі вектори порівнянні, наприклад, має сенс обчислити крапковий добуток і використовувати це значення подібності.
Моє запитання: які інструменти / алгоритми можуть допомогти класифікувати такі дані?
ОНОВЛЕННЯ: Дані мають таку властивість, що один або дуже мало векторів сильно впливають на мітку класу.
МОЖЛИВО РЕШЕННЯ: Після деяких досліджень схоже, що періодичні нейронні мережі (RNN) підходять до законопроекту досить природно. Загальна ідея полягає в тому, щоб вибрати розмір контексту , об'єднати вектори слів, зробити максимум об'єднань і подати це за допомогою класичного NN. У кожній можливій позиції вікна контексту в реченні будується вектор функції. Кінцевий вектор функцій будується, наприклад, за допомогою максимального об'єднання. Зворотне розповсюдження робиться для коригування параметрів мережі. Я вже отримав деякі позитивні результати (GPU є обов'язковим).