Тестування різниці в AIC двох не вкладених моделей


12

Вся суть АПК чи будь-якого іншого інформаційного критерію полягає в тому, що чим менше, тим краще. Отже, якщо у мене є дві моделі M1: y = a0 + XA + e і M2: y = b0 + ZB + u, а якщо AIC першого (A1) менший, ніж у другого (A2), то M1 має краща відповідність з точки зору теорії інформації. Але чи є якісь орієнтири відсічення для різниці A1-A2? На скільки менше насправді менше? Іншими словами, чи є тест на (A1-A2), крім просто очного яблука?

Редагувати: Петро / Дмитро ... Дякую за відповідь. Власне, це випадок, коли моя суттєва експертиза суперечить моїй статистичній експертизі. По суті, проблема полягає не в виборі між двома моделями, а в перевірці, чи дві змінні, які, як я знаю, значною мірою еквівалентні, додають еквівалентні обсяги інформації (Насправді одна змінна в першій моделі та вектор у другій. Подумайте про випадок купа змінних проти їх індексу.). Як зазначив Дмитрій, найкращою ставкою є тест Кокса. Але чи існує спосіб перевірити різницю між інформаційним змістом двох моделей?


Вам також може бути цікаво перевірити Wagonmakers та ін. (2004). Оцінка імітації моделі за допомогою параметричного завантажувального пристрою. Журнал математичної психології, 48 , 28-50. ( pdf ).
gung - Відновити Моніку

Відповіді:


13

Є чи питання з цікавості, тобто ви не задоволені моєю відповіддю тут ? Якщо ні...

Подальше дослідження цього каверзне питання показав , що існують широко використовуваний правило емпіричне, що держави - дві моделі невиразні I C критерієм , якщо різниця | A I C 1 - A I C 2 | < 2 . Те саме ви читаєте у статті wikipedia на A I C (зауважте, що посилання можна натискати!). Просто для тих, хто не натискає посилання:AIC|AIC1AIC2|<2AIC

оцінює відносну підтримку моделі. Щоб застосувати це на практиці, ми починаємо з набором моделейкандидатів, а потім знайти моделі відповідні I C значення. Далі, визначити мінімальну Я C значення. Вибір моделі може бути зроблений наступним чином.AICAICAIC

Як грубе правило, моделі, які мають свій в межах мінімуму, мають істотну підтримку і повинні враховуватись при прийнятті висновків. Моделі, які мають в межах приблизно від мінімального, мають значно меншу підтримку, тоді як моделі з вище мінімуму або по суті не підтримують і можуть бути опущені при подальшому розгляді або, принаймні, не пояснюють суттєвих структурних змін у дані.AICA I C 4 - 7 A I C > 1012AIC47AIC>10

Більш загальний підхід полягає в наступному ...

Позначимо значення моделей - кандидатів на , . Нехай позначає мінімум цих значень. Тоді можна інтерпретувати як відносну ймовірність того, що - модель мінімізує (очікувані оціночні) втрати інформації.A I C 1 A I C 2 , A I C 3 , , A I C R A I C m i n e ( A I C m i n - A I C i ) / 2 iAICAIC1AIC2,AIC3,,AICRAICmine(AICminAICi)/2i

Наприклад, припустимо, що у наборі кандидатів було три моделі зі значеннями , та . Тоді друга модель є разів більша, ніж перша модель, щоб мінімізувати втрати інформації, а третя модель рази настільки ж вірогідною, як перша модель мінімізації втрат інформації. У цьому випадку ми можемо опустити третю модель з подальшого розгляду та взяти середньозважене значення для перших двох моделей з вагами та відповідно. Далі статистичний висновок базуватиметься на зваженому мультимоделі.100 102 110 e ( 100 - 102 ) / 2 = 0,368 e ( 100 - 110 ) / 2 = 0,007 1 0,368AIC100102110e(100102)/2=0.368e(100110)/2=0.00710.368

Приємне пояснення та корисні пропозиції, на мій погляд. Просто не бійтеся читати те, що можна натискати!

Крім того , зауважте ще раз, що є менш кращим для масштабних наборів даних. На додаток до вам може бути корисно застосувати коригувану за версію критерію (ви можете використовувати цей код або використовувати формулу , де - кількість розрахункових параметрів). Правило великого пальця буде тим самим. В Я З Я С Я С з Я C C = я З + 2 р ( р + 1 )AICBICAICAICcR пAICc=AIC+2p(p+1)np1p


Привіт Дмитре ... Я знав, що ти це помітить. Власне, ваша відповідь на оригінальне запитання задала цей поїзд кочення. Я думав, що це поставить цікаве окреме питання. Проблема, з якою я стикаюся, полягає в тому, що статистичні тести (включаючи тест Кокса) є частими, і тому ви можете перевірити відмінності між двома моделями на певному визначеному рівні значущості. Але AIC / BIC ґрунтуються на ймовірності, і мені здається, що цифри неможливо порівняти безпосередньо, за винятком, як ви зазначаєте, великого правила. Оскільки заходи ІК залежать від масштабу, абсолютне значення (2) може бути проблематичним, ні?
user3671

@user, Абсолютне значення не є проблематичним. Ви можете піти на пропозицію щодо відносної ймовірності, тому ви, мабуть, будете впевнені в цьому, ніж якесь приємне значення . Під ефектом масштабу ви маєте на увазі, коли критерій менш упереджений у малих зразках та послідовний у великих? Спробуйте натомість а для невеликих зразків також буде хорошою альтернативою. Правило великих пальців досі корисно. 2 B I C A I C c22BICAICc
Дмитро Челов

1
@DmitrijCelov (+1 деякий час тому) приємна відповідь - дякую, що вставив текст, оскільки у Вікіпедії більше немає пунктів, охоплених у перших двох абзацах. Видалений абзац був цитований як p. 446: Burnham, K. P., and Anderson, D.R. (2002). Model Selection and Multimodel Inference: A Practical Information-Theoretic Approach, 2nd ed. Springer-Verlag. ISBN 0-387-95364-7. і Wiki сторінка попередньо перегляд тут
Джеймс Стенлі

Слід зазначити, що я не читав книгу Бернхема, і що стара посилання на Вікі підказує, що текст цитується як парафраза. FYI, сторінка Wiki відредагована о 16:52, 15 квітня 2011 р.
Джеймс Стенлі,

Чи можете ви допомогти у цьому подальшому питанні? stats.stackexchange.com/questions/349883 / ...
Tripartio

8

Я думаю, що це може бути спроба отримати те, чого ти насправді не хочеш.

Вибір моделі - це не наука. За винятком рідкісних обставин, немає жодної ідеальної моделі чи навіть однієї "справжньої" моделі; рідко буває навіть одна "найкраща" модель. Обговорення AIC проти AICc проти BIC проти SBC і проти будь-якого не залишають мене зненацька. Я думаю, ідея полягає в тому, щоб отримати деякі ДОБРІ моделі. Потім ви вибираєте серед них на основі поєднання предметних знань та статистичних ідей. Якщо у вас немає значущого досвіду (рідко це трапляється; набагато рідше, ніж вважає більшість людей), тоді вибирайте найнижчий AIC (або AICc або будь-який інший). Але зазвичай у вас є певний досвід - інакше чому ви досліджуєте саме ці змінні?


2
+1 для підкреслення необхідності як статистичної, так і предметної експертизи.
chl
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.