Чи існують якісь непідтримувані алгоритми навчання для послідовних даних за часом?


9

Кожне спостереження за моїми даними збиралося з різницею в 0,1 секунди. Я не називаю це часовим рядом, тому що в ньому немає позначки дати та часу. У прикладах алгоритмів кластеризації (я знайшов в Інтернеті) та PCA, вибіркові дані мають 1 спостереження на випадок і не присвоєні часу. Але мої дані мають сотні спостережень, зібраних кожні 0,1 секунди на транспортний засіб, і транспортних засобів багато.

Примітка. Це питання я задавав і на кворі.


1
Зверніть увагу на мову. Ваше питання абсолютно незрозуміле. Що означає "вибіркові дані мають 1 спостереження на кожний випадок і не присвоєні часу"?
Касра Маншаї

1
Я говорив про приклади, знайдені в онлайн-підручниках. Вибіркові дані, які вони використовують, містять лише 1 спостереження на кожний випадок / особу (наприклад, клієнт, країна тощо) І ці дані не є часовими рядами.
umair durrani

Відповіді:


7

У вас є послідовність подій відповідно до часу, тому не соромтесь називати це часовий ряд!

Кластеризація у часових рядах має 2 різні значення:

  1. Сегментація часових рядів, тобто ви хочете сегментувати окремий часовий ряд на різні часові інтервали відповідно до внутрішньої подібності.
  2. Кластеризація часових рядів, тобто у вас є кілька часових рядів, і ви хочете знайти різні кластери відповідно до подібності між ними.

Я припускаю, що ви маєте на увазі другу, і ось моя пропозиція:

У вас багато транспортних засобів і багато спостережень на транспортний засіб, тобто у вас багато транспортних засобів. Отже, у вас є кілька матриць (кожен транспортний засіб - це матриця), і кожна матриця містить N рядків (Nr спостережень) і T стовпців (часових точок). Одне з пропозицій могло б застосувати PCA до кожної матриці для зменшення розмірності та спостереження за даними в просторі ПК та побачити, чи є змістовні зв’язки між різними спостереженнями в матриці (транспортному засобі) . Потім ви можете покласти кожне спостереження за всіма транспортними засобами один на одного і скласти матрицю та застосувати PCA до цього, щоб побачити зв'язки одного спостереження між різними транспортними засобами.

Якщо у вас немає негативних значень, матрична факторизація настійно рекомендується зменшити розмірність даних матричної форми.

Ще одна пропозиція може поставити всі матриці один на одного і побудувати тензор N x M x T, де N - кількість транспортних засобів, M - кількість спостережень, а T - часова послідовність, і застосувати тензорний розклад, щоб побачити відносини в усьому світі.

Дуже приємний підхід до кластеризації часових рядів показаний у цьому документі, де реалізація тиха прямо вперед.

Сподіваюся, це допомогло!

Щасти :)


EDIT

Як ви згадали, ви маєте на увазі сегментацію часових рядів, я додаю це до відповіді.

Сегментація часових рядів є єдиною проблемою кластеризації, яка має основну істину для оцінки. Дійсно, ви розглядаєте генеруючий розподіл за часовим рядом і аналізуєте його, я настійно рекомендую це , це , це , це , це і це, де ваша проблема всебічно вивчається. Особливо останній та кандидатська дисертація.

Щасти!


1
Дякую за чудову відповідь. Моя мета, власне, - зробити "сегментацію часових рядів" для кожного транспортного засобу в моєму наборі даних.
umair durrani

1
Я вивчаю підручники з розкладання часових рядів. Я виявив, що існують способи їх розкласти на трендові, сезонні та циклічні компоненти. Однак у моєму часовому ряду є кілька секунд траєкторій руху транспортних засобів. Чи можливо розкласти їх на різні компоненти поведінки за кермом, виходячи з тенденцій прискорень, швидкостей, швидкості руху та прискорень автомобіля в межах спостережуваної траєкторії?
umair durrani

2
Можливо! для цього краще врахувати як "розкладання", так і "сегментацію". Наприклад, якщо ваш часовий ряд показує значні кластери в просторі ПК, ви можете пов'язати їх з поведінкою водіння. Сегментація також полягає у виявленні різної поведінки за кермом протягом часового ряду. Довга коротка історія полягає в тому, що ви можете використовувати сегментацію для різних сегментів поведінки за кермом для одного транспортного засобу та методи розкладання для виявлення глобальної поведінки за кермом для всіх транспортних засобів.
Касра Маншаї
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.