Проблема тут полягає в тому, щоб дійти до рівняння, яке аналізує спостережувані дані на сигнал і шум. Якщо ваші дані прості, то ваш регресійний підхід може працювати. Слід подбати про розуміння деяких припущень, які вони роблять із Пророком. Вам слід краще зрозуміти, що робить Пророк, оскільки це не просто відповідає простої моделі, але намагається додати певну структуру.
Наприклад, деякі роздуми, які я зробив, прочитавши їх добре написане вступ, можуть допомогти вам у вашій оцінці. Я заздалегідь прошу вибачення, якщо неправильно зрозумів їхній підхід, і хотів би виправитись, якщо так.
1) Їх ведучий приклад має в тренді дві точки перелому, але вони зафіксували лише найочевидніший.
2) Вони ігнорують будь-яку структуру ARIMA, що відображає пропущені стохастичні ряди або значення використання історичних значень Y для орієнтації на прогноз.
3) Вони ігнорують будь-яку можливу динаміку (ефект відведення та відставання) стохастичних та детермінованих рядів, запропонованих користувачем. Причинно-наслідкові регресійні ефекти Пророка просто просто сучасні.
4) Не робиться спроб визначити зрушення кроку / рівня в серії або сезонні імпульси, наприклад, зміна ЕФЕКТУ ПОНЕДІНИ на півдорозі через якусь невідому зовнішню подію. Пророк передбачає "простий лінійний ріст", а не перевіряє його, вивчаючи альтернативні можливості. Для можливого прикладу цього див. Прогнозування повторюваних замовлень для онлайн-підписки з використанням Facebook Prophet та R
5) Синуси та косинуси - це непрозорий спосіб поводження з сезонністю, тоді як сезонні наслідки, такі як день тижня, день місяця, тиждень місяця, місяць року набагато ефективніші / інформативніші при боротьбі з антропогенними (маючи справу з людьми!) ефектами.
Запропонувати частоту 365,25 для річних моделей має мало сенсу, оскільки ми не виконуємо ті ж дії в той самий день, як у минулому році, тоді як щомісячна активність набагато наполегливіша, але, схоже, Пророк не пропонує 11-місячних показників варіант. Щотижневі частоти 52 мало сенсу, тому що у нас немає 52 тижнів щороку.
6) Не робиться спроб перевірити помилкові процеси, які є гауссовими, тому можна зробити значущі тести на важливість.
7) Не турбуйтеся про те, щоб дисперсія помилок моделі була однорідною, тобто не змінювалась детерміновано в конкретні моменти часу, що передбачає зважені найменші квадрати. Не турбуйтеся щодо пошуку оптимальної силової трансформації для вирішення дисперсії помилок, пропорційної очікуваному значенню Коли (і навіщо) слід приймати журнал розподілу (чисел)? .
8) Користувач повинен заздалегідь вказати всі можливі наслідки відхилення та відставання навколо подій / свят. Наприклад, щоденні продажі часто починають зростати наприкінці листопада, що відображає довгостроковий ефект Різдва.
9) Не викликає занепокоєння, що отримані помилки не мають структури, що дозволяє запропонувати шляхи вдосконалення моделі за допомогою діагностичної перевірки достатності.
10) Мабуть, немає побоювань щодо вдосконалення моделі шляхом вилучення несуттєвої структури.
11) Не існує можливості отримати сімейство модельованих прогнозів, де межі довіри можуть не обов'язково бути симетричними через завантаження помилок моделі з урахуванням можливих аномалій.
12) Дозволяти користувачеві робити припущення щодо тенденцій (# точок прориву трендів і фактичних точок проходу) дозволяє отримати небажану / непридатну гнучкість в умовах масштабного аналізу, який за своїм ім'ям призначений для вільних масштабних програм.