Мене цікавить вибір моделі в налаштуваннях часових рядів. Для конкретності, припустимо, я хочу вибрати модель ARMA з пулу моделей ARMA з різними порядками відставання. Кінцевим наміром є прогнозування .
Вибір моделі може здійснити компанія
- перехресне підтвердження,
- використання інформаційних критеріїв (AIC, BIC),
серед інших методів.
Роб Дж. Хайндман пропонує спосіб зробити перехресну перевірку часових рядів . Для відносно невеликих зразків розмір вибірки, використаний у перехресній валідації, може бути якісно іншим, ніж вихідний розмір вибірки. Наприклад, якщо вихідний розмір вибірки становить 200 спостережень, тоді можна подумати про початок перехресної перевірки, взявши перші 101 спостереження та розширивши вікно до 102, 103, ..., 200 спостережень, щоб отримати 100 результатів перехресної перевірки. Зрозуміло, що модель, яка є достатньо парсимонічною для 200 спостережень, може бути занадто великою для 100 спостережень, і, отже, її помилка перевірки буде великою. Таким чином, перехресне підтвердження, ймовірно, систематично віддає перевагу занадто парсимонімним моделям. Це небажаний ефект через невідповідність розмірів вибірки .
Альтернативою перехресній валідації є використання інформаційних критеріїв для вибору моделі. Оскільки я дбаю про прогнозування, я би використовував AIC. Навіть незважаючи на те, що AIC асимптотично еквівалентний мінімізації одношагового прогнозованого одношагового прогнозу MSE для моделей часових рядів (відповідно до цього допису Роб Дж. Хайндманом), я сумніваюся, що це актуально з моменту вибірки розміри, про які я дбаю, не такі великі ...
Запитання: чи слід обрати перехресну валідацію AIC за часовими рядами для малих / середніх зразків?