Як передбачити, коли відбудеться наступна подія, виходячи з часів попередніх подій?

19

Я студент середньої школи і працюю над проектом комп’ютерного програмування, але не маю багато досвіду в галузі статистики та моделювання даних поза курсом статистики середньої школи, тому я ніби не розгублений.

В основному, у мене досить великий список (припустимо, він достатньо великий, щоб відповідати припущенням для будь-яких статистичних тестів чи заходів) разів, коли хтось вирішив надрукувати документ. Виходячи з цього списку, я хотів би побудувати статистичну модель, яка буде передбачати найбільш ймовірний час для наступного завдання друку з урахуванням усіх попередніх часів події.

Я вже це читав , але відповіді не дуже допомагають з того, що я маю на увазі для свого проекту. Я провів кілька додаткових досліджень і виявив, що прихована модель Маркова , ймовірно, дозволить мені зробити це точно, але я не можу знайти посилання на те, як генерувати приховану модель Маркова, використовуючи лише список разів. Я також виявив, що використання фільтра Кальмана у списку може бути корисним, але в основному я хотів би отримати додаткову інформацію про нього від того, хто насправді їх використав і знає їх обмеження та вимоги, перш ніж просто спробувати щось і сподіватися, що це працює.

Дякую купу!

— анкушг
джерело

1

+1 Це чітко сформульоване, добре продумане запитання, Анкуш. Я сподіваюся, що ви отримаєте чудові відгуки. Ласкаво просимо на наш сайт!

— whuber

Дякую, що виправили заголовок - я пересував слова, щоб спробувати зробити речі більш узгодженими, і, мабуть, я закінчився тим, що це зовсім не має сенсу! Сподіваємось, хтось із відповідними знаннями може допомогти.

— ankushg

10

Приховані моделі Маркова застосовуватимуться, якби дані були випадковими викидами від якоїсь основної непоміченої моделі Маркова; Я б не виключав цього, але це здається не дуже природною моделлю.

Я б подумав про точкові процеси , які добре відповідають вашим конкретним даним. Проводиться велика робота над прогнозуванням землетрусів (хоча я про це мало знаю) і навіть злочином .

Якщо друкується багато різних людей, і ви просто бачите часи, але не окремі ідентичності, процес Пуассона може спрацювати добре (суперпозиція декількох незалежних точкових процесів приблизно є Пуассоном), хоча це повинно бути неоднорідним ( шанс на очко змінюється з часом): люди рідше друкують о 3 ранку, ніж о 15:00.

Для неоднорідної моделі процесу Пуассона ключовим моментом було б отримати хорошу оцінку шансів на роботу надрукувати в певний час у конкретний день.

Якщо цей час друку призначений для учнів у класі, це може бути досить складним, оскільки вони, ймовірно, не будуть незалежними, і тому процес Пуассона не буде добре працювати.

Ось посилання на документ про застосування злочину.

— Карл
джерело

Дякую за це Чи знаєте ви будь-який спосіб створити модель для точкового процесу? Це, здається, є найбільш релевантним, але я не добре розбираюся в статистиці, тому це все здається заплутаним (Пуассон проти Детермінанталь проти Кокса?), Коли я читаю вікіпедію ...: - \

— ankushg

@Unk - я б почав із створення деяких графіків даних. Скільки триває цей список часу друку?

— Карл

Йдеться про рік, який вартує даних. Я зроблю кілька сюжетів і дам вам знати, як це йде.

— ankushg

1

На основі прогнозування ймовірного часу з використанням багатоваріантної байєсівської статистики сканування (MBSS) може бути корисним. Цей MBSS має перевагу в покращенні своєчасності та точності виявлення подій.

— Есан
джерело

Ласкаво просимо на сайт, @Esan. Чи можете ви сказати більше про MBSS, як він працює і як це допоможе?

— gung - Відновити Моніку