Ось трохи відповідь у лівому полі, який стосується лише «найкращих практик поєднання кількох моделей» частини вашого запитання. Це в основному моя дипломна робота, за винятком того, що я маю справу зі складними, дуже нелінійними моделями, які демонструють хаос та шумо - кліматичні моделі. Це, мабуть, не застосовується в багатьох галузях, але може бути корисним в екології та економетрії.
До недавнього часу у спільноті моделювання клімату моделі значною мірою просто розбивались у невагомому середньому (як правило, після корекції зміщення, що передбачає вилучення середньої моделі для частини або всього періоду вибірки). Це в основному те, що МГЕЗК зробив для четвертого звіту про оцінку (4AR) та попередніх звітів.
Це більш-менш приклад школи " правда плюс помилка " ансамблевої комбінації, де мовчазно або явно припускається, що спостережні серії (наприклад, глобальна температура, локальні опади тощо) є істинними, і що якщо взяти достатню кількість зразків (наприклад, пробіг моделі), шум у виконанні моделі скасовується (див. (1)).
Останнім часом використовуються методи комбінування моделей на основі продуктивності . Оскільки кліматичні моделі настільки шумні та мають стільки змінних та параметрів, єдиним способом оцінки працездатності (про який я знаю) є проведення коваріації або взяття MSE між результатами моделі та спостережуваним часовим рядом. Потім моделі можна комбінувати шляхом зважування середнього значення, виходячи з цієї міри. У цій статті (2) є хороший огляд цього.
Одне з припущень цього методу комбінування симуляцій - це припущення, що всі моделі є досить незалежними - якби деякі сильно залежали, вони б змістили середнє значення. Це припущення було досить справедливим для набору даних, використовуваних для 4AR ( CMIP3 , оскільки цей набір даних складався з кількох модельних циклів з багатьох моделюючих груп (з іншого боку, код поділяється в модельному співтоваристві, тому все ще може бути деяка взаємозалежність Для цікавого погляду на це див. (3)) Набір даних для наступного звіту про оцінку, CMIP5, не має цього дещо вдалого атрибуту - деякі моделюючі команди подають кілька запускань, а деякі - сотні. Ансамблі, що надходять від різних колективів, можуть створюватися за допомогою початкової перубації стану або за допомогою зміни фізичної моделі та параметризації. Крім того, цей супер ансамбль не пробований систематично - це просто той, хто коли-небудь приносить дані, приймається (в межах розуму). Це відоме на місцях як " ансамбль можливостей ". Існує велика ймовірність, що використання невзваженого середнього для такого ансамблю дозволить вам навести кілька головних ухилів до моделей з більшою кількістю пробіжок (оскільки, хоч і існує сотні пробіжок, можливо, набагато менша кількість справді незалежних пробіжок).
На даний момент мій керівник оглянув документ, що описує процес комбінації моделей, що передбачає зважування продуктивності та незалежності . Доступний реферат для конференції (4), я опублікую посилання на статтю, коли вона опублікована (повільний процес, не затримуйте дихання). В основному, в цьому документі описаний процес, який включає прийняття коваріації помилок моделі (model-obs) та зважування моделей, що мають високу коваріантність з усіма іншими моделями, (наприклад, моделі з сильно залежними помилками). Обчислюється також дисперсія помилок моделі та використовується як компонент зважування продуктивності.
Варто також зазначити, що кліматичне моделювання, очевидно, сильно впливає на капризи чисельного моделювання в цілому. Існує річ, яка називається "тест на сміх" - якщо ви закінчите модельний цикл, який передбачає, що середні глобальні температури до 2050 року становитимуть + 20 ° C, ви просто викинете її, оскільки це очевидно не є фізично актуальним. Очевидно, цей вид тесту є досить суб'єктивним. Я цього ще не вимагав, але сподіваюсь найближчим часом.
Це моє розуміння комбінації моделей держави в моєму полі на даний момент. Очевидно, я ще вчуся, тому, якщо натрапляю на щось особливе, я повернусь та оновлю цю відповідь.
(1) Tebaldi, C. & Knutti, R., 2007. Використання багатомодельного ансамблю в імовірнісних прогнозах клімату. Філософські трансакції Королівського товариства A: Математичні, фізичні та інженерні науки, 365 (1857), с.2053–2075.
(2) Кнутті, Р. та ін., 2010 р. Нарада експертів МГЕЗК з питань оцінки та комбінування мультимодельних кліматичних прогнозів.
(3) Masson, D. & Knutti, R., 2011. Генеалогія кліматичної моделі. Геофіс. Рез. Lett, 38 (8), p.L08703.
(4) Abramowitz, G. & Bishop, C., 2010. Визначення та зважування модельної залежності в прогнозуванні ансамблів. Тези доповідей AGU Fall Meeting. p. 07.