Ця проблема насправді стосується виявлення пожежі, але вона є аналогічною деяким проблемам виявлення радіоактивного розпаду. Явища, що спостерігаються, є як спорадичними, так і дуже мінливими; таким чином, часовий ряд буде складатися з довгих рядків нулів, перерваних змінними значеннями.
Мета - це не просто фіксація подій (перерви в нулі), а кількісна характеристика самих подій. Однак датчики обмежені, і, таким чином, іноді буде записувати нуль, навіть якщо "реальність" не дорівнює нулю. З цієї причини при порівнянні датчиків повинні бути включені нулі.
Датчик B може бути більш чутливим, ніж датчик A, і я хотів би мати можливість це статистично описати. Для цього аналізу у мене немає «правди», але у мене є датчик C, який не залежить від датчиків A&B. Таким чином, я сподіваюся, що краща згода між A / B і C означає кращу згоду з "правдою". (Це може здатися хитким, але вам доведеться мені довіряти. Я тут твердий, виходячи з того, що відомо з інших досліджень про датчики).
Отже, проблема полягає в тому, щоб кількісно оцінити "кращу погодження часових рядів". Кореляція - це очевидний вибір, але на неї впливатимуть усі ті нулі (які не можна оминути), і, звичайно, непропорційно впливають максимальні значення. RMSE також може бути обчислена, але вона буде сильно зважена до поведінки датчиків у випадку майже нуля.
Q1: Який найкращий спосіб застосувати логарифмічне масштабування до ненульових значень, які потім будуть об'єднані з нулями в аналізі часових рядів?
Q2: Які «найкращі практики» ви можете порекомендувати для аналізу часових рядів такого типу, коли поведінка при ненульових значеннях є фокусом, але нульові значення домінують і їх неможливо виключити?