Я будую інтерактивний інструмент прогнозування (в python) як допоміжний засіб для прогнозування, який робиться в моїй організації. На сьогоднішній день процес прогнозування значною мірою керується людьми: прогнозисти засвоюють дані у своїх природних нейронних мережах та використовують свої вивчені кишки для прогнозування. На основі довгострокової перевірки прогнозу та прогнозного моделювання я знайшов те, що ви можете очікувати; різні синоптики демонструють різні упередження, вплив деяких прогнозів, здається, завищений, а інші важливі, здається, ігноруються, і загалом результати прогнозу є посередніми порівняно з порівняно простими емпіричними моделями.
Прогнози й надалі будуть ручними, але я намагаюся створити корисний інструмент, щоб забезпечити синоптикам кращу кількісну оцінку відносних ефектів прогнозів. Існують також важливі ефекти, такі як сезонні впливи, які часто не помічають, що я хотів би виділити цей інструмент для користувача. Я очікую певного рівня зворотного зв'язку та скептицизму щодо процесу моделювання від деяких «досвідченіших» синоптиків (багато хто з них мають мало офіційних статистичних знань), тому комунікація є як мінімум такою ж важливою, а сама ефективність моделі з точки зору досягнення вимірюваного покращення точності прогнозу.
Моделі, які я розробляю, мають сильну авторегресивну складову, яка часом суттєво модифікована подіями, які відображаються як виміряні значення в деяких передбачувачах, які в часи без подій близькі до нуля. Це відповідає ментальній моделі, яку використовують синоптики. Ключова частина полягає в тому, щоб продемонструвати, які з вимірювань "події" є найбільш впливовими для відхилення прогнозу від значення авторегресії для будь-якого прогнозу. Я зображую процес таким чином; синоптик визначає їх найкращі здогадки, модель пропонує інше, а синоптик запитує, чому. Модель відповідає щось на кшталт "дивіться, це значення цього прогноктора збільшує прогнозне значення влітку. Якби була Зима, вона рухалася б іншим способом. Я знаю, що існують ці інші вимірювання,
Тепер, уявіть, модель була простою лінійною регресією. Можна було б уявити показ відносного "ефекту" прогнозів, заснованих на подіях, помноживши значення на коефіцієнт корисної дії та відображаючи як просту діаграму. Усі смуги різних прогнокторів складають загальне відхилення від значення AR, і це коротко і чітко показує ті, які в даному випадку мають сильний вплив.
Проблема полягає в тому, що прогнозований процес виявляє високу ступінь нелінійності в прогнозах, або, принаймні, я мав набагато більший успіх у нелінійних алгоритмах машинного навчання «чорний ящик» (випадковий ліс та ГБМ), ніж у GLM для цей набір даних. В ідеалі я хотів би мати можливість безперешкодно змінити модель, що працює "під капотом", не змінюючи досвіду користувача, тому мені потрібен певний загальний спосіб продемонструвати важливість різних вимірювань без використання певного алгоритму підходу. Моїм сучасним підходом буде квазілінеаризація ефектів шляхом встановлення всіх значень до нуля, за винятком одного прогноктора, записування прогнозованого відхилення та повторення для всіх прогнокторів, відображення результатів у згаданій вище гістограмі. За наявності сильної нелінійності це може бути не так добре.