Я хотів би використовувати модель бінарної логістичної регресії в контексті потокової передачі даних (багатовимірний часовий ряд), щоб передбачити значення залежної змінної даних (тобто рядка), що щойно надійшла, враховуючи минулі спостереження. Наскільки я знаю, логістичну регресію традиційно застосовують для післясмертного аналізу, де кожна залежна змінна вже встановлена (або шляхом інспекції, або за характером дослідження).
Що трапляється у випадку часових рядів, коли ми хочемо передбачити (на ходу) щодо залежної змінної з точки зору історичних даних (наприклад, у часовому вікні останніх секунд) і, звичайно, попереднього оцінки залежної змінної?
І якщо ви бачите вищезгадану систему з часом, як її слід побудувати для того, щоб регресія працювала? Чи потрібно нам спочатку тренувати це, позначаючи, скажімо, перші 50 рядків наших даних (тобто встановлюючи залежну змінну до 0 або 1), а потім використовувати поточну оцінку вектора для оцінки нової ймовірності залежної змінної 0 або 1 для даних, які тільки що надійшли (тобто новий рядок, який щойно додали до системи)?
Щоб зробити свою проблему більш зрозумілою, я намагаюся створити систему, яка аналізує набір даних рядок за рядками і намагається зробити прогноз бінарного результату (залежна змінна), враховуючи знання (спостереження чи оцінку) всіх попередніх залежних чи пояснювальних даних змінні, які надійшли у фіксованому часовому вікні. Моя система знаходиться в Rerl і використовує R для висновку.