Що PCA робить з автокорельованими даними?


9

Тільки тому, що якийсь кореспондент поставив цікаве питання щодо методів обчислення автокореляції, я почав з ним грати, майже не маючи ніяких знань про часові ряди та автокореляцію.

Кореспондент розмістив свої дані ( точки даних часового ряду), зміщені на один часовий проміжок, крім того, щоб у нього була матриця даних (наскільки я його зрозумів), де перший рядок є вихідними даними, другий рядок дані зміщуються на одиницю часу, наступний рядок - на інший тощо. Я зрозумів це додатково, приклеївши кінець до хвоста, тому зробив «кругові» набори даних.3232×321

Тоді, просто шукаючи, що може вийти з цього, я обчислив кореляційну матрицю і з цього основні компоненти. Дивно, але я отримав зображення розкладання частоти, і (знову ж таки, з іншими даними) однієї частоти, сказати, що з одним періодом у дані були в першому головному компоненті, і що з чотирма періодами був у другому ПК і так далі (У мене було "відповідних" ПК із власним значенням326>1). Спочатку я думав, що це залежить від вхідних даних, але тепер я припускаю, що це систематично таким чином, завдяки спеціальній конструкції набору даних з його круговими зрушеннями (також відомою як матриця "Toeplitz"). Обертання PC-рішення варімакса або інших критеріїв обертання дало дещо інші результати, і, можливо, цікаві, але результати, як правило, забезпечують таке частотне розкладання.

Ось посилання на фотографії, які я зробив із кратного набору даних; криві просто виготовляються з навантажень факторної матриці: одна крива навантажень на один коефіцієнт. Крива першого PC1 повинна показувати найбільшу амплітуду (приблизно тому, що вона несе найбільшу суму завантажувальних квадратів)32

Запитання:

  • Q1: Це особливість дизайну? (PCA з таким типом набору даних)
  • Q2: Чи справді такий підхід корисний для серйозного підходу до аналізу частоти / довжини хвилі?

[оновлення] ось набір даних (сподіваємось, що він може скопіюватися для вас)

-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4
-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5
-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3
0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1
2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0
4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2
6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4
5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6
3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5
1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3
1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1
0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1
-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0
-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2
-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3
0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1
3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0
5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3
7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5
6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7
7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6
5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7
4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5
3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4
2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3
3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2
5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3
4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5
3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4
2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3
3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2
4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3

Дякую @amoeba і за багато редагування. Я бачив лише дві помилки, які хотів відредагувати пізніше, питання зараз виглядає набагато приємніше!
Готфрід Гельмс

Відповіді:


4

Дозвольте мені перетворити свій попередній коментар у відповідь.

Чи уявляєте ви, що рядки в вашій матриці даних є змінними або зразками? Я припускаю, що це зразки: тобто у вас різних часових ряду (зразки).n=32

Тоді, якщо всі рядки однакові, але лише кругові зміщені на позицію в кожному, то матриця грам у ваших даних, що складається з крапок добутку між усіма парами рядків, матиме структуру Toeplitz: високі значення близькі до діагонально і поступово зменшуючись до нульових значень від нього. Матриці Toeplitz мають послідовні режими Фур'є, оскільки їх власні вектори (і власні вектори матриці Грама є основними компонентами, аж до масштабування), так що так для вашого Q1: не дивно, що ви отримуєте синусоїдальні хвилі зростаючої частоти як ПК.n=321n×n

Не маю уявлення, чи може це бути корисно (Q2). На мій досвід, це, як правило, представляється дратівливим артефактом. Тобто люди мають деякі дані, отримують щось із зовнішнього вигляду Фур'є з PCA і починають цікавитись, що вони можуть означати, тоді як вони просто пов'язані з деякими часовими зрушеннями в початковому часовому ряду.


Ну, дуже приємно, дякую! Так, я подумав, що дані в рядках. Q2 приходить ще й тому, що я до цього часу ніколи не розумів, як саме працює аналіз Фур’є - і випадково це міг стати одним кроком, щоб отримати певну інтуїцію (але ця невиразна надія тут справді здається безрезультатною)
Готфрід Хелмс

До речі, ви не проти поділитися своїми 32-х ціновими часовими серіями? Я хотів би вставити фігуру, що показує матрицю Грама, і я міг би це зробити безпосередньо з вашими даними.
амеба

Ви бачили посилання в моєму запитанні? Він переспрямовує на веб-сторінку, яку я створив за допомогою exce.l. У ній є 4 або 5 підсторінок, які "firefox" можна вибрати в моїй установці кліком на панелі вкладок у нижній частині екрана. Перша підсторінка показує список даних. Однак вертикально: слід прийняти його як перший рядок у новій таблиці та додати 31 рядок, рухаючи велосипед праворуч. Якщо це незручно, я можу також додати дані до свого запитання ...
Готфрід Хелмс

О, вау, я не розумів, що це ціла електронна таблиця, а не просто скріншот! Дякую.
амеба
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.