Які відмінності між термінами «аналіз часових рядів» та «поздовжній аналіз даних»


17

Говорячи про поздовжні дані, ми можемо неодноразово посилатися на дані, зібрані протягом одного часу від одного предмета / навчальної одиниці, таким чином, існують кореляції для спостережень у межах одного предмета, тобто схожість предмета.

Говорячи про дані часових рядів, ми також посилаємось на дані, зібрані протягом декількох періодів часу, і це здається дуже схожим на згадані вище поздовжні параметри.

Мені цікаво, чи може хтось дати чітке уточнення між цими двома термінами, що таке взаємозв'язок і які відмінності?


1
Це може перетворитись на опитування ... Я працював над обома типами даних, і одна ключова відмінність, здається, полягає в тому, що поздовжні дані часто використовуються в причинно-наслідкових аналізах, щоб зрозуміти вплив втручань чи лікування, тоді як часові ряди часто використовуються в прогнозуванні . Зрозуміло, різниця не є чіткою (вам потрібно зрозуміти основні драйвери для прогнозування. ІМО ви не зрозуміли драйвери, якщо не зможете добре прогнозувати). Але люди, які виявляють сигнал у часових рядах, часто не так сильно піклуються про прогнозування, тому, ймовірно, вони відкинуть мою відмінність.
Стефан Коласа

Дякуємо за ваші коментарі. Але я думаю, що термін «причинний зв’язок» тут може бути невідповідним, а термін «асоціація» повинен бути кращим? Що стосується мети аналізу даних, я думаю, що ваші коментарі мали певний сенс для мене. Але чи не можемо ми використовувати поздовжні дані для прогнозу? Оскільки це також дані про часові ряди.
запитання

1
У вас є точка "причинно-наслідкової" проти "асоціації", і, звичайно, поздовжні дані можна використовувати для прогнозування - просто я часто не бачу цих двох понять разом. Синоптики зазвичай говорять про часові ряди. Крім цього, я не міг би сказати це краще, ніж @gung.
Стефан Коласа

3
Однією з можливих типових (не визначених) відмінностей є те, що у часових рядах ви бачите та моделюєте час відповіді як залежний від стану t - 1 ; це ефект переносу . У процесі поздовжнього аналізу ви зазвичай вважаєте час постійним , еволюційним фоновим фактором. тт-1
ttnphns

4
Дивіться також інші теми, наприклад, stats.stackexchange.com/questions/7110/… stats.stackexchange.com/questions/11413/…
Nick Cox

Відповіді:


19

Сумніваюся, існують чіткі формальні визначення, з якими погоджується широке коло аналітиків даних.

Однак загалом часовий ряд означає одну одиницю дослідження, що спостерігається через рівні проміжки часу протягом дуже тривалого періоду часу. Прототипним прикладом може бути річний приріст ВВП країни протягом десятиліть чи навіть більше ста років. Для аналітика, який працює в приватній компанії, це можуть бути щомісячні доходи від продажів протягом життя компанії. Оскільки існує так багато спостережень, дані аналізуються дуже детально, шукаючи такі речі, як сезонність за різні періоди (наприклад, щомісяця: більше продажів на початок місяця відразу після того, як люди виплачуються; щорічно: більше продажів у листопаді та Грудень, коли люди роблять покупки на різдвяний сезон), і, можливо, зміна режиму. Прогнозування часто є дуже важливим, як зазначає @StephanKolassa.

Поздовжнє, як правило, стосується меншої кількості вимірювань для більшої кількості одиниць дослідження. Прототипним прикладом може бути випробування на наркотики, де сотні пацієнтів вимірюються на початковому рівні (до лікування) та щомісяця протягом наступних 3 місяців. За допомогою лише 4 спостережень за кожною одиницею у цьому прикладі неможливо спробувати виявити види особливостей, які цікавлять аналітиків часових рядів. З іншого боку, з пацієнтами, імовірно, рандомізованими на озброєння та контроль за зброєю, про причинність можна зробити висновок один раз було вирішено питання незалежності. Як це наводить на думку, часто незалежність вважається скоріше неприємністю, а не первинною ознакою інтересу.


9

Існує приблизно три види наборів даних:

  • переріз: різні предмети одночасно; уявляйте це як один рядок з безліччю стовпців, що відповідають різним темам;
  • часовий ряд: однаковий предмет у різний час; уявляйте це як один стовпець із рядками, що відповідають різним часовим точкам;
  • панель (поздовжня): багато предметів у різний час, у вас однаковий предмет у різний час, і у вас є багато предметів одночасно; уявляйте це як таблицю, де рядки є часовими точками, а стовпці - предметами.

2
Виходячи з ваших коментарів, здається, що поздовжні дані - це сукупність даних, що збираються з різних предметів?
запитання

1
Як правило, так, ви могли бачити дані кожного предмета як часові ряди. На практиці, однак, у поздовжніх даних часто є дуже мало часу для кожного предмета. Вони називають хвилями часових точок . Наприклад, це може бути медичне дослідження, коли кожний пацієнт проводить 4-5 спостережень щомісяця, а сотні пацієнтів протягом багатьох років. Таким чином, набори даних на панелях часто є неврівноваженими (подумайте про дуже розрізнену таблицю), тому в поздовжніх дослідженнях є свої улюблені методи боротьби з цим.
Аксакал

Це корисно з огляду на питання, але існує багато інших видів наборів даних, які не підпадають під жоден із цих заголовків. Однак вони не здаються актуальними для цього питання, і намагання класифікувати всі можливі види набору даних тут будуть марними. Приклади: будь-який набір даних, де основна структура підпорядковується предмету x; будь-який набір даних, який не є двовимірним.
Нік Кокс

@NickCox, правда, але я в економетрії, і ці три - це ті, хто має розроблені теорії, і в основному використовуються в нашій галузі
Аксакал,

2
Ви ні в чому не сумніваєтесь, але нічого в цьому питанні не зобов'язує і не заохочує вузько економетричну точку зору, і ваша конкретна точка зору не була виразною.
Нік Кокс

3

Ці два терміни можуть не бути пов’язані між собою тим, як передбачає ОП - тобто я не думаю, що вони конкурують з режимами аналізу.

Натомість аналіз часових рядів описує набір методів нижчого рівня, які можуть бути корисними для аналізу даних у поздовжньому дослідженні.

Об'єктом дослідження в аналізі часових рядів є деякий залежний від часу сигнал.

Більшість методик аналізу та моделювання / прогнозування цих залежних від часу сигналів побудовані на передумові, що ці сигнали можна розкласти на різні компоненти. Два найважливіші:

  • циклічні компоненти (наприклад, щоденні, щотижневі, щомісячні, сезонні); і

  • тенденція

Іншими словами, аналіз часових рядів заснований на використанні циклічного характеру сигналу, що залежить від часу, для отримання основного сигналу.


0

Щоб зробити це простішим, я припускаю дослідження людей, але те саме стосується будь-якої одиниці аналізу. Це не складно, тимчасові ряди - це дані, зібрані з часом, що зазвичай мають на увазі те саме вимірювання з еквівалентної сукупності через окремі часові інтервали - або збираються постійно, але аналізуються через часові інтервали.
Поздовжні дані значно ширші за обсягом. Еквівалентна сукупність замінюється ідентичною сукупністю, тому окремі дані можуть з часом спаровуватися або об'єднуватися. Поздовжні дані можуть бути повторними вимірюваннями або не залежно від мети дослідження. Коли поздовжні дані виглядають як часовий ряд, це коли ми вимірюємо одне і те ж із часом. Велика різниця полягає в тому, що за часовим рядом ми можемо виміряти загальну зміну вимірювання у часі (або за групою), тоді як у поздовжньому аналізі ви фактично маєте вимірювання змін на індивідуальному рівні. Таким чином, у вас є набагато більший потенціал для аналізу, і вимірювання змін є без помилок, якщо йдеться про вибірки, тож поздовжнє дослідження може бути більш точним та інформативним.


0

Що таке поздовжні дані?

Поздовжні дані, які іноді називаються даними на панелі, відслідковують один і той же зразок в різні моменти часу. Вибірка може складатися з осіб, домогосподарств, установ тощо. На відміну від цього, повторні дані поперечного перерізу, які також забезпечують довгострокові дані, дають одне і те ж опитування для різних вибірок у часі.

Поздовжні дані мають ряд переваг перед повторними даними поперечного перерізу. Поздовжні дані дозволяють вимірювати зміну внутрішньої вибірки у часі, дозволяють вимірювати тривалість подій та фіксувати терміни різних подій. Наприклад, припустимо, що рівень безробіття залишався високим протягом тривалого періоду. Можна скористатися поздовжніми даними, щоб побачити, чи однакова група людей залишається без роботи протягом усього періоду чи якщо різні групи осіб переміщуються та виходять з безробіття протягом періоду часу.

Джерело

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.