Мені хотілося б оцінити кілька різних моделей, які забезпечують передбачення поведінки на щомісячному рівні. Дані збалансовані, і 100 000 і T = 12. Результат відвідує концерт у визначеному місяці, тож він дорівнює нулю для ~ 80% людей у будь-якому місяці, але довгий правий хвіст важких користувачів. Прогнози, які я маю, схоже, не поважають підрахунку результату: переважають дробові концерти.
Я нічого не знаю про моделі. Я тільки спостерігати 6 різних прогнозів чорного ящика у 1 , . . . , У 6 для кожної людини в місяць. У мене є додатковий рік даних про те, що модельєри не мали для оцінки (хоча концертники залишаються однаковими), і я хотів би оцінити, де кожен виступає добре (з точки зору точності та точності). Наприклад, чи прогнозує якась модель добре для часто відвідувачів концертів, але не вдається для картоплі? Чи прогноз на січень кращий, ніж прогноз на грудень? Крім того, було б непогано знати, що прогнози дозволяють мені правильно класифікувати людей з точки зору фактичних даних, навіть якщо точній величині не можна довіряти.
Моя перша думка полягала в тому, щоб запустити регресії з фіксованими ефектами, фактичні на передбачувані манекени та час, і подивитися на RMSE або для кожної моделі. Але це не дає відповіді на питання про те, де кожна модель працює добре, чи відмінності значні (якщо я не завантажую RMSE). Розподіл результатів мене також хвилює при такому підході.
Друга моя ідея полягала в тому, щоб розподілити результат на 0, 1-3 і 3+ і обчислити матрицю плутанини, але це ігнорує часовий вимір, якщо я не зроблю 12 з них. Це також досить грубо.
Мені відомо про команди Stata concord
від TJ Steichen та NJ Cox - які є цією by()
можливістю, але це вимагало б збір даних до річних підсумків. Це обчислює індекс співвіднесеності Ліна з інтервалами довіри, серед інших корисних статистичних даних. CCC коливається від -1 до 1, з ідеальною згодою в 1.
Як би ви вирішили цю проблему? Чи запропонували б ви обчислити статистику типу MAPE, яка є загальною для прогнозування?
Корисні речі, знайдені дотепер:
- Слайди за повторною мірою версії коефіцієнта кореляції коефіцієнта узгодження Ліна