Сильно нерегулярний часовий ряд


10

У мене є дані про популяцію декількох різних риб, відібраних за період від 5 років, але за дуже нерегулярною схемою. Іноді між зразками бувають місяці, іноді є кілька проб за один місяць. Також багато 0 підрахунків

Як поводитися з такими даними?

Я можу досить легко зобразити його в R, але графіки не особливо яскраві, тому що вони дуже сильні.

З точки зору моделювання - з видами, змодельованими як функції різних речей - можливо змішана модель (також багаторівнева модель).

Будь-які посилання чи ідеї вітаються

Деякі деталі у відповідь на коментарі

Існує близько 15 видів.

Я намагаюся як би уявити будь-які тенденції чи сезонність у кожної риби, і дивлюсь, як види пов’язані один з одним (мій клієнт спочатку хотів просту таблицю кореляцій)

Мета - описова та аналітична, а не прогностична

Подальші редагування: я знайшов цей документ К. Рейфілда та ін., Який пропонує використовувати ядра Гаусса для оцінки АЧС для сильно нерегулярних часових рядів

http://www.nonlin-process-geophys.net/18/389/2011/npg-18-389-2011.pdf


1
Я не потрібний хлопець, щоб відповісти на ваше запитання, але багаторівнева модель звучить розумно. Будь-які натяки на те, наскільки великі зразки, скільки видів, і як виникає нульовий підрахунок? (На останньому пункті, чи є спроби зразків випадкових зразків, або вони упереджені, як ви щойно отримали підрахунки від змагань із риболовлі, які, ймовірно, не дадуть жодного сома?)
Уейн,

1
"Справа з" означає, що саме? Деякі ідеї щодо подолання нерегулярного часу шукайте цей сайт на "+ нерегулярний + час"
whuber

Чи можете ви уточнити вибірку та мету? Наприклад, це захоплення-повторне захоплення? Чи це мережа, розміщена в потоці протягом певного періоду часу, без випуску? Чи намагаєтесь ви оцінити майбутні розміри вибірки чи більшу кількість населення, з якої складається вибірка? Чи є зразки з 1 або декількох місць? У неправильних часових рядах немає нічого поганого, але трохи важко зрозуміти зв’язок між подіями вибірки та між зразками та деякою цільовою змінною (наприклад, реакція моделі). Також ціль має характер прогностичного чи описового характеру?
Ітератор

2
Чому хтось проголосував це питання? Чому б не спробувати допомогти розробити кращі запитання чи відповіді?
Ітератор

2
@Iterator Тому що навіть зараз, після "подальших редагувань", тут немає чіткого питання. Оголошення (подане після того, як відповідь не була помічена на мій перший коментар) була розміщена для того, щоб заохотити ОП забезпечити необхідні вдосконалення, а також сигнал про єдиний частково сформований стан питання, наскільки він стояв. Справа не в тому, щоб кожен читач (а також модники) не здогадувався, що призначено!
whuber

Відповіді:


10

Я витратив досить багато часу на створення загальних рамок для нерівномірно розподілених часових рядів: http://www.eckner.com/research.html

Крім того, я написав документ про оцінку тенденцій та сезонності для нерівномірно розподілених часових рядів.

Сподіваюся, ви знайдете результати корисними!


5
Дякую! Цей аналіз був давно, і я вже не роблю цього, але подібні речі можуть з’явитися знову; та інші дуже багато шукають ці теми, тому ваш коментар не витрачається даремно.
Пітер Флом

Дякуємо за інформацію (та й справді через роки хтось в Інтернеті її шукає!), Але посилання затихло.
Зачепили

2

Я не знаю, чи дуже підходить змішана модель (використовуючи стандартні пакети, де структура випадкових ефектів є лінійним прогноктором), якщо ви не вважаєте, що дані в усі моменти часу в певному сенсі повинні бути обмінними між собою (у цьому випадку нерегулярні інтервали - це не проблема) - це насправді не може моделювати тимчасову автокореляцію розумним чином. Можливо, ти можеш підманути Лмера () зробити якусь автогресивну річ, але як саме ти це зробиш, уникнеш мене зараз (я не можу думати прямо). Крім того, я не впевнений, що таке "змінна групування", що індукує автокореляцію в сценарії змішаної моделі.

Якщо тимчасова автокореляція є неприємним параметром, і ви не очікуєте, що це теж будевеликий, тоді ви можете поповнити дані в епохи, які по суті не відрізняються одна від одної з точки зору кореляції (наприклад, розділити часовий ряд у точках, де немає місяців за місяцями) і переглянути їх як незалежні репліки. Потім ви можете зробити щось на зразок GEE на цьому модифікованому наборі даних, де "кластер" визначається, в яку епоху ви перебуваєте, а записи робочої кореляційної матриці є функцією того, наскільки далеко були зроблені спостереження. Якщо ваша функція регресії правильна, то ви все одно отримаєте послідовні оцінки коефіцієнтів регресії, навіть якщо кореляційна структура не вказана неправильно. Це також дозволить вам моделювати його як дані підрахунку, використовуючи, наприклад, журнал-посилання (як це зазвичай робиться в пуассоновій регресії). Ви також можете створити різницю між видами, де кожна часова точка розглядається як багатоваріантний вектор видів, що враховується з деякою тимчасово розпадається асоціацією між часовими точками. Для цього знадобиться деяка попередня обробка, щоб обдурити стандартні пакети GEE.

Якщо тимчасова автокореляція не є параметром неприємностей, я б спробував щось більше, як структурована модель коваріації, де ви розглядаєте весь набір даних як одне спостереження за великим багатоваріантним вектором, таким, що коваріація між спостереженнями за видами є u , vYс,Yту,v

cоv(Yс,Yт)=fθ(с,т,у,v)

де - деяка параметрична функція, відома до кінцевої кількості параметрів, , поряд з низкою параметрів для управління середньою структурою. Можливо, вам знадобиться "створити власну" для такої моделі, але я також не здивуюсь, якщо існують MPLUS-пакети, щоб зробити такі речі для підрахунку даних.θfθ


Дякую @macro Я думаю, що змішана модель може бути в порядку, оскільки вони часто використовуються для вкладених в часі даних; Мене не так цікавить моделювання автокореляції - тобто це неприємність. Я погоджуюся, що час не буде лінійним, але я можу додати ефекти часу (не впевнений, який з них ще, але я можу його дослідити). У мене немає MPLUS, але у мене є R і SAS.
Пітер Флом

1
Я кажу лише, що стандартна змішана модель може бути невідповідною в цій ситуації. Випадковий перехоплення марно, якщо ви не думаєте, що моменти часу можуть бути замінними з точки зору кореляції (тобто він пропонує лише наближення у світі "обмінної кореляції" до вашої справжньої структури кореляції). Включення випадкових нахилів у часі вказує на те, що ви думаєте, що траєкторія з часом "кудись рухається" - оскільки сюжет не дуже освітлюється для вас, це, мабуть, не відбувається. Я визнаю, ви, можливо, зможете підманути lmer () зробити щось більш підходяще.
Макрос

2
+1 Хороша, лаконічна відповідь, що стосується всіх основних моментів, які я б хотів вирішити, та багато іншого. Щодо пакетів на R, пошук CRAN в Google для [poisson regression temporal] виявляється декількома пакунками. У surveillanceпакеті може бути потрібна функціональність. Цей вид моделювання не є рідкістю в екологічних дослідженнях, тому, мабуть, найкраще знайти хороший пакет в екологічних куточках CRAN.
Ітератор
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.