Тестування гіпотез та значення для часових рядів


19

Звичайним тестом на значущість при розгляді двох груп є t-тест, по можливості парний t-тест. Це передбачає, що розподіл є нормальним.

Чи є подібні спрощення припущень, які створюють тест на значимість для часового ряду? Зокрема, у нас є дві досить невеликі популяції мишей, яких лікують по-різному, і ми вимірюємо вагу раз на тиждень. Обидва графіки відображають плавно зростаючі функції, при цьому один графік точно вище іншого. Як ми можемо кількісно оцінити "визначеність" у цьому контексті?

Нульовою гіпотезою має бути те, що ваги двох груп населення «поводяться однаково» з часом. Як можна сформулювати це на основі простої моделі, яка є досить поширеною (як звичайні розподіли звичайні) із лише невеликою кількістю параметрів? Як тільки хтось зробив це, як можна виміряти значущість чи щось подібне до p-значень? А як з паруванням мишей, узгодженням якомога більше характеристик, причому кожна пара має по одному представнику від кожної з двох популяцій?

Я вітаю покажчик на якусь відповідну добре написану та легко зрозумілу книгу чи статтю про часові ряди. Я починаю як невіглас. Спасибі за вашу допомогу.

Девід Епштейн


Ви можете подати більш широку мережу, оскільки це не обов'язково питання часового ряду. Дійсно, мабуть, найбільш фундаментальне питання тут стосується найкращого або принаймні правильного способу кількісної оцінки «кінцевої точки» лікування: чи означає це зростання чисельності населення через певний час, середні темпи зростання з часом тощо? Якщо ви не знали цього перед початком експерименту і раптом помічаєте послідовні відмінності в кривих зростання, то ви працюєте в дослідницькому режимі, не підтверджувальному, і тестування гіпотез p-значень буде оманливо хорошим.
whuber

Результат є якісно, ​​як очікувалося, і однобічний тест видається доцільним. Причина, яку я запитав про часовий ряд, полягає в тому, що якщо вимірювати лише остаточну вагу (що є найбільш релевантним вимірюванням), то викидають всю інформацію з попередніх часових моментів, і це здається неправильним.
Девід Епштейн

Ви маєте рацію: не хочете викидати ці дані. Але методи часових рядів виходять на перший план для моделей даних, де тимчасова кореляція відхилень від ідеалізованих кривих є важливою, чи то заради їх власного інтересу, чи тому, що вони можуть заважати хорошій оцінці. Мабуть, ваша ситуація не потрапить ні в один із цих випадків. Доступні простіші, більш науково значимі методи.
качан

@whuber, чи не є вагою контрольного набору мишей у часі "ідеалізована крива" в якомусь сенсі? Або, принаймні, теоретична модель, пристосована до цих даних?
naught101

1
Так, @naught, це розумний спосіб поглянути на це. Але "крива" - це не те саме, що "часовий ряд". Наприклад, лінійна регресія може розглядатися як підходить криві до даних, але є окремою від аналізу часових рядів, що підкреслює структуру кореляцій між відхиленнями між даними та ідеалізованою кривою.
whuber

Відповіді:


1

Існує багато способів зробити це, якщо ви вважаєте зміни ваги як динамічний процес.

Наприклад, його можна моделювати як інтегратор x˙(t)=θx(t)+v(t)

x(t)θv(t)v(t)N(0,Q)Q

θθθ1θ2

Для довідки я можу запропонувати цю книгу .


0

Я б запропонував визначити модель ARIMA для кожної миші окремо, а потім переглянути їх на предмет подібності та узагальнення. Наприклад, якщо перша миша має AR (1), а друга - AR (2), найбільш загальною (найбільшою) моделлю буде AR (2). Оцініть цю модель глобально, тобто для комбінованого часового ряду. Порівняйте суму помилок квадратів для комбінованого набору з сумою двох окремих помилок суми квадратів, щоб генерувати значення F для перевірки гіпотези постійних параметрів по групах. Я хочу, щоб ви могли розмістити свої дані, і я точно проілюструю цей тест.

ДОДАТКОВІ КОМЕНТАРІ:

Оскільки набір даних автоматично корелює, нормальність не застосовується. Якщо спостереження з часом не залежать, то можна застосувати деякі відомі методи нечасних рядів. З точки зору Вашого запиту про легку для читання книгу про часові ряди, я пропоную текст Вей від Аддісон-Веслі. Соціологи вважають, що нематематичний підхід Mcleary and Hay (1980) є більш інтуїтивним, але йому не вистачає суворості.


1
Це дійсно не видається для вирішення фундаментальних проблем. (1) Чому така модель підходить? (2) Чому кожну мишу слід моделювати, а не, скажімо, середньої ваги чи приросту у вазі? (3) Чому тест постійних параметрів має значення? Питання напрошується для однобічного тесту. Більшість параметрів, які ви згадуєте, не здаються науково значимими, а також вони не кількісно визначають значення того, що один графік послідовно знаходиться над іншим. (4) Як ви контролюєте можливі відмінності в характеристиках двох груп на початку експерименту?
whuber

: whuber Тест на сталість параметрів є релевантним, оскільки у вас є набір коефіцієнтів для першої групи читань формули 1 та другого набору коефіцієнтів для 2-ї миші. Питання "чи існує взагалі незначна різниця між коефіцієнтами". Тепер, продовжуючи свій коментар, Оскільки один із модельних коефіцієнтів може бути постійним, і якщо це, то різниця між коефіцієнтами може бути, оскільки константи статистично відрізняються одна від одної. Зауважте, що в основі моделі ARIMA необов'язково можуть бути константи, це може бути модель різниці.
IrishStat

1
Я думаю, ви частково праві, але вам потрібно уточнити свою характеристику проблеми. Багато коефіцієнтів ARIMA можуть бути науково нерелевантними. Наприклад, якщо один з них діє з часом як квадратичний термін, різниця може дещо сказати про форму кривих зростання, але це може бути мало корисно. Якщо вибирати коефіцієнти для відображення експериментальної кінцевої точки (ів) і випробовувати лише їх, то може бути досягнуто деякого блага. Однак загалом моделі часового ряду вводять коефіцієнти (наприклад, автокореляція), які навряд чи становлять тут прямий науковий інтерес.
whuber

whuber: "Якщо вибирати коефіцієнти для відображення експериментальної кінцевої точки (-ів) і випробовувати лише їх, то користь може бути досягнута тим самим" для мене не має великого сенсу, оскільки він ігнорує проміжні моменти. Навпаки, на ваш коментар, режим часового ряду та супутні його коефіцієнти представляють істотний науковий інтерес, оскільки він характеризує розподіл показань і перетворює їх у випадковий процес (термін помилки), який не має автокореляційної структури, а потім піддається тестам що вимагає нормальності. Тест, який я пропоную, вимагає цього припущення виконати.
IrishStat

1
Автокореляція тут може мати незначне значення. Інтерес чітко зосереджується на тенденціях: як основні криві зростання мають тенденцію до різниці між двома групами населення? Параметри автокореляції - це параметри неприємності, які слід вводити та обробляти лише в тому випадку, якщо вони можуть допомогти покращити оцінку цих кривих зростання. Перший пріоритет - прийняти наукову модель зростання, представити цю модель з параметрами, які інтерпретуються та представляють інтерес, та оцінити їх. Автоматичне застосування методів часових рядів навряд чи цього досягне.
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.