З того, що я можу сказати, між AIC та BIC немає великої різниці. Вони обидва математично зручні наближення можна зробити для ефективного порівняння моделей. Якщо вони дають вам різні «найкращі» моделі, це, ймовірно, означає, що у вас висока невизначеність моделі, про що важливіше хвилюватися, ніж використовувати AIC або BIC. Мені особисто більше подобається BIC, тому що він запитує більше (менше) моделі, якщо вона має більше (менше) даних, щоб відповідати її параметрам - на зразок вчителів, які просять про вищий (нижчий) рівень продуктивності, якщо їхній учень має більше (менше ) час дізнатися про предмет. Мені це просто здається інтуїтивно зрозумілим. Але я впевнений, що для AIC також існує однаково інтуїтивні та переконливі аргументи, враховуючи її просту форму.
Тепер, коли ви зробите наближення, напевно будуть певні умови, коли ці наближення є сміттям. Це, безумовно, можна побачити для AIC, де існує багато "коригувань" (AICc) для врахування певних умов, які роблять початкове наближення поганим. Це також існує для BIC, оскільки існують різні інші більш точні (але все-таки ефективні) методи, такі як наближення повністю Лапласа до сумішей g-пріорів Зельнера (BIC - це наближення до методу наближення Лапласа для інтегралів).
Одне місце, де вони обидва лайна, - це коли у вас є значна попередня інформація про параметри в будь-якій моделі. AIC та BIC надмірно штрафують моделі, де параметри частково відомі порівняно з моделями, які вимагають оцінювати параметри з даних.
П( Д | М, А )П( М| D,A )ММА
Мi: i-та модель - найкращий опис данихА : з безлічі моделей K, що розглядається, одна з них є найкращою
А потім продовжую призначати ті самі моделі ймовірностей (ті ж параметри, ті ж дані, ті ж наближення тощо), я отримаю той самий набір значень BIC. Лише приєднуючи якесь унікальне значення до логічної літери "М", втягується у нерелевантні питання про "справжню модель" (відгомони "справжньої релігії"). Єдине, що "визначає" M - це математичні рівняння, які використовують його у своїх обчисленнях, - і це навряд чи виокремлює одне і лише одне визначення. Я міг би однаковою мірою висловити передбачення щодо М ("i-я модель дасть найкращі прогнози"). Я особисто не бачу, як це змінить будь-яку ймовірність, а отже, наскільки хорошим чи поганим буде BIC (АІК також з цього приводу - хоча АПК базується на іншому виведенні)
І , крім того, що трапилося з твердженням Якщо справжня модель в наборі я розглядаю, тобто 57% вірогідність того , що модель B . Мені здається досить розумним, або ви можете перейти на більш "м'яку" версію, існує 57% ймовірність того, що модель B найкраща з набору, що розглядається
Останній коментар: Я думаю, ви знайдете приблизно стільки ж думок про AIC / BIC, скільки людей, які знають про них.