Пристосований розподіл до просторових даних


10

Перехресно розміщуючи моє запитання від mathoverflow, щоб знайти конкретну допомогу щодо статистики.

Я вивчаю фізичний процес, генеруючи дані, які чітко проектуються у два виміри з негативними значеннями. Кожен процес має (проектовану) доріжку з - точок - див. Зображення нижче.xy

Зразки доріжок синього кольору, клопіткий тип доріжки був намальований зеленим кольором, а область, яка викликає занепокоєння, намальована червоним кольором: сліди та область, що викликає занепокоєння

Кожен трек є результатом незалежного експерименту. Протягом декількох років було проведено двадцять мільйонів експериментів, але з цих лише двох тисяч виявляється особливість, яку ми закладаємо як доріжку. Ми стурбовані лише експериментами, які генерують трек, тому наш набір даних становить (приблизно) дві тисячі треків.

Можливо, щоб доріжка потрапила в область, яка викликає занепокоєння, і ми очікуємо, що це буде для порядку на треків. Оцінка цього числа є питанням, про яке йдеться:1104

Як ми можемо обчислити ймовірність потрапляння довільної колії в область, що викликає занепокоєння?

Неможливо провести експерименти досить швидко, щоб побачити, як часто генеруються треки, які потрапляють у область, що викликає занепокоєння, тому нам потрібно екстраполювати з наявних даних.

Ми встановили, наприклад, значення задані , але це недостатньо обробляє дані, такі як зелена доріжка - здається, необхідна модель, що включає обидва виміри.xy200

Ми встановили мінімальну відстань від кожної колії до регіону, який викликає занепокоєння, але ми не переконані, що це дає виправданий результат.

1) Чи відомий спосіб пристосування розподілу до цього типу даних для екстраполяції?

або

2) Чи існує очевидний спосіб використання цих даних для створення моделі для генерації треків? Наприклад, використовуйте аналіз основних компонентів на треках як точки у великому просторі, а потім встановіть розподіл (Pearson?) На композиції, запроектовані на ці компоненти.


1
Я не повинен давати більше інформації про конкретний процес, але я оновлю питання, щоб говорити про те, як збираються дані.
Джефф Снайдер

1
Я оновив мову, щоб спробувати бути більш конкретним. Уявіть, що ми кидаємо камінчики у відкрите вікно верхнього поверху, і нам байдуже лише, як камінчики, які проходять через вікно, підстрибують на підлогу всередині. Ми кинули мільйони камінчиків, і близько 2000 пройшли через вікно. Коли камінчик проходить через вікно, ми малюємо доріжку його ходу по підлозі. Враховуючи, що камінчик проходить через вікно, ми хочемо оцінити ймовірність того, що він пройде через область, що занепокоєє.
Джефф Снайдер

Відповіді:


1

Здається, ви хочете імітувати формування треків, а потім провести моделювання Монте-Карло, щоб побачити, скільки композицій потрапляє в червону область. Для цього я б спершу перетворив лінії на дві функції, одна задала напрямок, а інша відстань від однієї точки до іншої на цій доріжці. Тепер ви можете вивчити розподіли ймовірностей, пов'язані з цими двома функціями. Наприклад, ви можете виявити, що пройдена відстань слідує конкретному розподілу (будьте уважні, щоб розподіл не змінювався з часом). Якщо будь-яка змінна з часом змінюється, то вам доведеться заглибитися в аналіз часових рядів (не моє поле, вибачте).

Ще одна думка, яка спадає на думку, полягає в тому, що оскільки напрямок руху в xy поступово змінюється на більшості композицій, ви можете краще вивчити зміну напрямку та часу для треків.

Вам також потрібно буде оцінити ймовірність того, що трек починається з заданої координати xy із заданим напрямком. Ви можете розглянути можливість використання оцінки щільності ядра для згладжування отриманого PDF або, якщо, здається, слідкує за розподілом, для якого існує аналітична модель, тоді максимізація очікування може бути використана для пристосування цього розподілу до даних.

Моделювання в Монте-Карло потім вибирало б випадкові зразки з цих розподілів, щоб імітувати форми доріжок. Тоді вам доведеться імітувати велику кількість доріжок і бачити, як часто ці треки проходять через червону область. Це може бути тисячі або мільйони треків, вам доведеться поекспериментувати, щоб побачити, коли розповсюдження не припиняється, коли ви додаєте більше записів.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.