Навіщо взагалі використовувати Дурбін-Уотсон замість тестування автокореляції?


10

Тест Дербіна-Уотсона тестує автокореляцію залишків у відстані 1. Але так само тестує автокореляцію на відстані 1 безпосередньо. Крім того, ви можете протестувати автокореляцію з відставанням 2,3,4, і є хороші тести на портманто на автокореляцію в декількох лагах, і ви отримаєте хороші, легко інтерпретовані графіки [наприклад, функцію acf () в R]. Дурбін-Уотсон не є зрозумілим для розуміння і часто дає непереконливі результати. То навіщо взагалі його використовувати?

Це надихнуло це питання про непереконливість деяких тестів Дурбіна-Уотсона, але явно від нього окремо.


1
Ви насправді можете зробити Дурбін-Ватсона для інших відставань. Знайдіть узагальнену статистику Дурбіна-Уотсона.
Брендон Шерман

Відповіді:


8

Як було зазначено раніше у цій та інших темах: (1) Тест Дурбіна-Уотсона не є переконливим. Лише межі, запропоновані Пербіном Дурбіном та Уотсоном, були тому, що точний розподіл залежить від спостережуваної регресорної матриці. Однак це вже досить просто вирішити в статистичному / економетричному програмному забезпеченні. (2) Існують узагальнення тесту Дурбіна-Уотсона на більш високі відставання. Тож ні непереконливість, ні обмеженість відстань не є аргументом проти тесту Дурбіна-Уотсона.

Порівняно з тестом Вальда залежної залежної змінної, тест Дурбіна-Уотсона може мати більшу потужність у певних моделях. Зокрема, якщо модель містить детерміновані тенденції або сезонні структури, то можна краще перевірити на автокореляцію в залишках (як це робить тест Дурбіна-Уотсона) порівняно з включенням відсталої реакції (яка ще не скоригована для детермінованих моделей) . Я включаю невеликий моделювання R нижче.

Одним з важливих недоліків тесту Дурбіна-Уотсона є те, що він не повинен застосовуватися до моделей, які вже містять авторегресивні ефекти. Таким чином, ви не можете перевірити наявність залишкової автокореляції після часткового фіксації її в авторегресивній моделі. У такому сценарії потужність випробування Дурбіна-Уотсона може повністю зруйнуватися, наприклад, для тесту Бреуша-Годфрі, наприклад, цього немає. У нашій книзі "Прикладна економетрія з R" є невелике імітаційне дослідження, яке показує це у розділі "Програмування власного аналізу", див. Http://eeecon.uibk.ac.at/~zeileis/teaching/AER/ .

Для набору даних з тенденцією плюс автокорельовані помилки потужність тесту Дурбіна-Уотсона вище, ніж для тесту Бреуша-Годфрі, проте, а також вище, ніж для тесту Вольда на авторегресивний ефект. Я ілюструю це для простого невеликого сценарію в Р. Я черпаю 50 спостережень з такої моделі і обчислюю p-значення для всіх трьох тестів:

pvals <- function()
{
  ## data with trend and autocorrelated error term
  d <- data.frame(
    x = 1:50,
    err = filter(rnorm(50), 0.25, method = "recursive")
  )

  ## response and corresponding lags
  d$y <- 1 + 1 * d$x + d$err
      d$ylag <- c(NA, d$y[-50])

  ## OLS regressions with/without lags
  m <- lm(y ~ x, data = d)
  mlag <- lm(y ~ x + ylag, data = d)

  ## p-value from Durbin-Watson and Breusch-Godfrey tests
  ## and the Wald test of the lag coefficient
  c(
    "DW" = dwtest(m)$p.value,
        "BG" = bgtest(m)$p.value,
    "Coef-Wald" = coeftest(mlag)[3, 4]
  )
}

Тоді ми можемо змоделювати 1000 p-значень для всіх трьох моделей:

set.seed(1)
p <- t(replicate(1000, pvals()))

Тест Дурбіна-Уотсона призводить до найнижчих середніх p-значень

colMeans(p)
##        DW        BG Coef-Wald 
## 0.1220556 0.2812628 0.2892220 

і найвища потужність на рівні 5% значущості:

colMeans(p < 0.05)
##        DW        BG Coef-Wald 
##     0.493     0.256     0.248 

Отже, ще одне обмеження статистики DW полягає в тому, що його не можна використовувати, якщо модель вже намагається контролювати автокореляцію. Я ціную той факт, що DW має більшу потужність, ніж Уолд або Бреш-Годфрі (жодного з яких я не використовував), але моє звичайне порівняння - тест на портманто, як Ljung-Box, та індивідуальні автокореляції порівняно з нулем 0. Це типовий режим прогнозування підручників.
zbicyclist

2
Це насправді не інше обмеження IMO, а основне обмеження. Інші питання (обчислення p-значень, а не меж і кількості відстань) можуть бути вирішені. І будьте обережні з інтерпретацією потужності: я сказав, що в цій конкретній моделі - детермінованій тенденції з терміном помилки AR (1) - тест Дурбіна-Уотсона має більшу потужність. Це може бути не так у багатьох інших налаштуваннях. Що стосується тесту Ljung-Box: Так, це класичний тест для перевірки наявності автокореляції, що залишилася після встановлення моделі ARIMA.
Ахім Зейлейз

3

Тест Дюрбіна-Уотсона - це те, як ви перевіряєте на автокореляцію. Створення проекту ACF - це як зробити графік QQ для перевірки на нормальність. Вміти заглядати сюжет QQ для перевірки на нормальність корисно, але тест Колмогорова-Смірнова або Левене доповнює те, що ви бачите в сюжеті, оскільки тест гіпотези на нормальність є більш переконливим.

Що стосується кількох відставань, ви можете використовувати узагальнену статистику Дурбіна-Уотсона, виконати кілька тестів на гіпотезу та зробити корекцію Бонферроні, щоб виправити багаторазове тестування. Ви також можете запустити тест Бреша-Годфрі , який перевіряє наявність кореляції будь-якого порядку.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.