Оцінка параметрів просторового процесу


12

Мені надається сітка позитивних цілих значень. Ці цифри представляють інтенсивність, яка повинна відповідати силі віри людини, що займає місце розташування сітки (вище значення, що вказує на більшу віру). Людина взагалі матиме вплив на декілька комірок сітки.н×н

Я вважаю, що схема інтенсивності повинна "виглядати гауссова", оскільки там буде центральне місце високої інтенсивності, а потім інтенсивності звужуються радіально у всіх напрямках. Зокрема, я б хотів моделювати значення як такі, що походять від "масштабного гаусса" з параметром для дисперсії та іншим для коефіцієнта масштабу.

Є два ускладнюючих фактори:

  • відсутність людини не буде відповідати нульовому значенню через фоновий шум та інші ефекти, але значення повинні бути меншими. Вони можуть бути нестабільними, але при першому наближенні може бути важко моделювати як простий шум Гаусса.
  • Діапазон інтенсивності може змінюватися. Для одного екземпляра значення можуть становити від 1 до 10, а для іншого - від 1 до 100.

Я шукаю відповідну стратегію оцінки параметрів або вказівники на відповідну літературу. Вказівки на те, чому я взагалі підходжу до цієї проблеми неправильно, також були б вдячні :). Я читав про кригінг та процеси Гаусса, але це здається дуже важкою технікою для моєї проблеми.


1
Що ви маєте на увазі під гауссом з параметром дисперсії та масштабу? Параметр дисперсії є параметром масштабу Гауссіан! Я також трохи не впевнений у створеній вами моделі. Чи можете ви описати проблему, яку ви насправді намагаєтесь вирішити? Використання Гаусса для моделювання спостережень з цілими цілими цілями, що здається цілими, здається непростим.
кардинал

(+1) За цікаве запитання. З нетерпінням чекаємо розуміння того, що ви намагаєтеся вирішити трохи краще.
кардинал

Ось кілька спостережень: 1. Якщо ваші значення цілі, використання Гаусса не здається доцільним. 2. Незрозуміло, яка мета вашої моделі, ви хочете, наприклад, визначити скупчення твердих переконань? Якою буде інтерпретація ваших параметрів, якщо ви їх мали? 3. Оскільки у вас є сітка, чому б не спробувати помістити суміш біваріантних розподілів? Тоді сітка буде опорою розподілу (скажімо, одиничний квадрат), а інтенсивності відповідатимуть областям високої ймовірності.
mpiktas

Дякую всім за цікаві моменти. Дозвольте спробувати уточнити. Вибір "Гауссана", у світлі коментарів, може бути червоною оселедцем, яка викликає більше плутанини, ніж допомагає. Ключовою особливістю даних є високі значення інтенсивності в точці найвищої віри в місце розташування людини і звуження «радіально» навколо неї (що я спостерігав емпірично). Значення інтенсивності походять від рішення до (лінійної) оберненої задачі, і тому насправді не обов'язково бути цілісним - це лише ті дані, які ми маємо.
Суреш Венкатасубраманян

btw Я ціную спроби зробити це питання більш чітко визначеним та більш чітким. Я докладу всіх зусиль, щоб пояснити фактичні параметри даних, щоб сходити правильні припущення щодо моделювання.
Суреш Венкатасубраманян

Відповіді:


5

Ви можете використовувати цей модуль бібліотеки пісальних пітонів для методів аналізу просторових даних, які я обговорюю нижче.

Ваш опис того, як на ставлення кожної людини впливає ставлення людей, які її оточують, може бути представлено просторовою авторегресивною моделлю (SAR) (також дивіться моє просте пояснення SAR з цієї відповіді SE 2 ). Найпростіший підхід - ігнорувати інші фактори та оцінити силу впливу того, як оточуючі впливають на відношення один до одного, використовуючи статистику І-го Морана .

Якщо ви хочете оцінити важливість інших факторів, оцінюючи силу впливу оточуючих людей, більш складне завдання, тоді ви можете оцінити параметри регресії: . Дивіться документи тут . (Методи оцінки цього типу регресії походять з області просторової економетрики і можуть отримати набагато складніший результат, ніж я дав посилання.)у=бх+rгодоWу+е

Вашим завданням буде скласти матрицю просторових ваг ( ). Я думаю , що кожен елемент ш я J матриці повинен бути 1 або 0 на основі люди чи я перебуваю на деякій відстані ви відчуваєте , що це необхідно , щоб впливати на інша людина J .Wшijij

Щоб отримати інтуїтивне уявлення про проблему, нижче я проілюструю, як просторовий процес автоматичного генерування даних (DGP) буде формувати значення. Для двох грат модельованих значень білі блоки представляють високі значення, а темні блоки - низькі.

У першій решітці нижче сітки значення генеруються нормально розподіленим випадковим процесом (або Гауссом), де дорівнює нулю.rгодо

Випадковий (гаусський)

У наступній решітці нижче сітки значення були породжені просторовим авторегресивним процесом, де було встановлено на щось високе, скажімо, .8. rгодовведіть тут опис зображення


Це дуже цікаво (і так пов'язано з Geary C). Це може бути близьким до того, що мені потрібно.
Суреш Венкатасубраманян

Geary C допомагає вам побачити, як значення, близькі один до одного кластеру, навіть значення в середині розподілу. Моран І допомагає вам побачити, як дуже високі значення кластеруються з дуже високими значеннями, а дуже низькі значення кластеруються навколо дуже низьких значень. Тож, можливо, ви правильні, а найпростіший і найкращий метод - це Geary's C. Пам'ятайте, що підхід Geary's C є дослідницьким і не дозволить вам обумовлювати свої результати щодо інших факторів. Подивіться на цей модуль python для коду для запуску C Geary: pysal.org/1.1/library/esda/geary.html .
b_dev

Дозвольте пограти ще з цими. Якщо здається, що я роблю те, що мені потрібно (і я думаю, що це буде), це звучить як найкраща відповідь.
Суреш Венкатасубраманян

3

Ось проста ідея, яка може спрацювати. Як я вже говорив у коментарях, якщо у вас сітка з інтенсивністю, чому б не підходити до щільності двовимірного розподілу?

Ось зразковий графік для ілюстрації моєї точки зору: введіть тут опис зображення

Кожна точка сітки з відображається у вигляді квадрата, кольорового за інтенсивністю. Накладений на графік контурний графік біваріантної графіку нормальної щільності. Як ви бачите, контурні лінії розширюються у напрямку зменшення інтенсивності. Центр буде контролюватися середнім значенням біваріантної норми та поширенням інтенсивності за коваріаційною матрицею.

Для отримання оцінок середньої та коваріаційної матриці можна використовувати просту числову оптимізацію, порівняти інтенсивності зі значеннями функції щільності, використовуючи середнє значення та матрицю коваріації в якості параметрів. Мінімізуйте для отримання оцінок.

Це, звичайно, суворо кажучи, не є статистичною оцінкою, але, принаймні, це дасть вам уявлення, як діяти далі.

Ось код для відтворення графіка:

require(mvtnorm)
sigma=cbind(c(0.1,0.7*0.1),c(0.7*0.1,0.1))

x<-seq(0,1,by=0.01)
y<-seq(0,1,by=0.01)
z<-outer(x,y,function(x,y)dmvnorm(cbind(x,y),mean=mean,sigma=sigma))

mz<-melt(z)

mz$X1<-(mz$X1-1)/100
mz$X2<-(mz$X2-1)/100

colnames(mz)<-c("x","y","z")

mz$intensity<-round(mz$z*1000)

ggplot(mz, aes(x,y)) + geom_tile(aes(fill = intensity), colour = "white") + scale_fill_gradient(low = "white",     high = "steelblue")+geom_contour(aes(z=z),colour="black")

2

Х[i,j]Х[i,j](Х[i1,j1],...,Х[iм,jм])(Х[i1+к,j1+л]...,Х[iм+к,jм+л])cоrr(Х[i1,j1],Х[i2,j2])г([i1,j1],[i2,j2])ρ(г)ρ(г)=кг-1к

г([i1,j1],[i2,j2])=|i1-i2|+|j1-j2|ρ(г)наприклад, через максимальну ймовірність. Для отримання додаткових ідей шукайте "випадкове поле".


1
"Хочеться припустити просторову стаціонарність", як видається, прямо суперечить припущенню ОП про те, що "інтенсивності звужуються радіально у всіх напрямках".
whuber

Як так? Така закономірність матиметься із запропонованою мною структурою автокореляції.
charles.y.zheng

1
@charles Важливий момент: якщо дійсно цю очевидну тенденцію слід віднести до автокореляції, то в принципі інша незалежна реалізація процесу може мати різно інший тренд, наприклад, збільшення вартості від центральної точки. Оскільки ОП чітко сформулював та виділив деякі детерміновані елементи до тенденції ("радіальне звуження") та кореляційні елементи ("мають вплив на декілька комірок сітки"), відповідь, яка поважає це, швидше за все, буде сприйнята більш позитивно, ніж одна, яка стверджує. ОП "захоче" змінити свою думку.
whuber

Я не впевнений, що розумію умову просторової стаціонарності. Здається, це, здається, суперечить ідеї мати "пік, який звужується" у певному місці, але я явно щось не розумію.
Суреш Венкатасубраманян

1
@charles, шаблон, який ви описуєте, буде присутній для кожної з точок сітки, завдяки припущенню просторової стаціонарності. Стаціонарність в основному говорить про те, що всі мої моменти поводяться однаково. Це не той випадок, описаний ОП. Відповідь все-таки дуже хороша, але не підходить у цьому випадку.
mpiktas
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.