На с. 34 свого PRNN Брайан Ріплі зауважує, що "AIC був названий Akaike (1974)" інформаційним критерієм ", хоча, як видається, вважається, що A означає Akaike". Дійсно, вводячи статистику AIC, Akaike (1974, с.719) пояснює це
"IC stands for information criterion and A is added so that similar statistics, BIC, DIC
etc may follow".
Розглядаючи цю цитату як передбачення, зроблене в 1974 році, цікаво відзначити, що всього за чотири роки два типи статистики BIC (Байєсська ІС) були запропоновані Akaike (1977, 1978) та Schwarz (1978). Знадобилося Spiegelhalter та ін. (2002) набагато довше, щоб придумати DIC (Deviance IC). Хоча Akaike (1974) не передбачав появи критерію CIC, але було б наївно вірити, що він ніколи не розглядався. Він був запропонований Карлосом К. Родрігесом у 2005 р. (Зауважимо, що Р. Тібширані та К. Найт (Критерій інфляції коваріації) - інша річ.)
Я знав, що EIC (емпіричний ІС) був запропонований людьми з Університету Монаша приблизно в 2003 році. Я щойно відкрив критерій орієнтованої інформації (FIC). Деякі книги відносять Інна Ханнана та Квінн як ГІК, див. Напр., Цю ). Я знаю, що повинен бути GIC (Узагальнений ІС), і я щойно відкрив критерій для інвестування інформації (IIC). Є NIC, TIC та інше.
Я думаю, що я міг би охопити решту алфавіту, тому я не запитую, де зупиняється послідовність AIC, BIC, CIC, DIC, EIC, FIC, GIC, HIC, IIC, ... або які букви алфавіту мають не використовуються або не використовуються принаймні двічі (наприклад, E в EIC може означати розширений або емпіричний). Моє запитання простіше, і я сподіваюся, більш корисне. Чи можу я використовувати ці статистичні дані взаємозамінно, ігноруючи конкретні припущення, в яких вони були виведені, конкретні ситуації, в яких вони повинні були застосовуватися тощо?
Це питання частково мотивоване Burnham & Anderson (2001), написавши, що:
...the comparison of AIC and BIC model selection ought to be based on their performance
properties such as mean square error for parameter estimation (includes prediction) and
confidence interval coverage: tapering effects or not, goodness-of-fit issues,
derivation of theory is irrelevant as it can be frequentist or Bayes.
Розділ 7 монографії Hyndman та ін. Про експоненціальне згладжування, як видається, слідкує за порадами BA, коли вивчає, наскільки добре працює п'ять альтернативних ІС (AIC, BIC, AICc, HQIC, LEIC) при виборі моделі, яка найкраще прогнозує (як виміряно) нещодавно запропонованим заходом помилки під назвою MASE) для висновку, що АПК частіше є кращою альтернативою. (HQIC був зареєстрований як найкращий селектор моделі лише один раз.)
Я не впевнений, яка корисна мета дослідницьких вправ, які неявно ставляться до всіх ІСС, як ніби вони отримані для відповіді на одне і те ж питання у рівнозначних наборах припущень. Зокрема, я не впевнений, наскільки корисно дослідити прогнозну ефективність послідовного критерію для визначення порядку авторегресії (що Ханнан і Квін отримали для ергодичних стаціонарних послідовностей), використовуючи його в контексті нестаціонарної експоненціально моделі згладжування, описані та проаналізовані в монографії Hyndman et al. Я чогось тут пропускаю?
Список літератури:
Akaike, H. (1974), Новий погляд на ідентифікацію статистичної моделі, IEEE Transaction on Automatic Control 19 (6), 716-723.
Akaike, H. (1977), Про принцип максимізації ентропії, в PR Krishnah, ed., Applications of statistics , Vol. 27, Амстердам: Північна Голландія, стор 27-41.
Akaike, H. (1978), Байєсівський аналіз мінімальної процедури АПК, Анали Інституту статистичної математики 30 (1), 9-14.
Burnham, KP & Anderson, DR (2001) Інформація Kullback – Leibler як основа для сильного висновку в екологічних дослідженнях, дослідження дикої природи 28, 111-119
Hyndman, RJ, Koehler, AB, Ord, JK & Snyder, RD Прогнозування з експоненціальним згладжуванням: підхід до державного простору. Нью-Йорк: Спрингер, 2008
Ріплі, розпізнавання образів BD та нейронні мережі . Кембридж: Cambridge University Press, 1996
Schwarz, G. (1978), Оцінка розмірності моделі, Annals of Statistics 6 (2), 461-464.
Spiegelhalter, DJ, Best, NG, Carlin, BP та van der Linde, A. (2002), Байєсові заходи складності моделі та т (з обговоренням), Журнал Королівського статистичного товариства. Серія B (Статистична методологія) 64 (4), 583-639.