Як знайти коваріаційну матрицю багатокутника?

Уявіть, що у вас є багатокутник, визначений набором координат $(x_1,y_1)...(x_n,y_n)$ і його центр маси знаходиться в $(0,0)$ . Ви можете трактувати багатокутник як рівномірний розподіл з полігональною межею.

Я шукаю метод, який знайде матрицю коваріації багатокутника .

Я підозрюю, що матриця коваріації багатокутника тісно пов'язана з другим моментом області , але чи є вони еквівалентними, я не впевнений. Формули, знайдені у статті вікіпедії, до якої я пов’язаний, здаються (здогадка тут, мені не особливо зрозуміло із статті), стосуються інерції обертання навколо осей x, y та z, а не основних осей полігону.

(До речі, якщо хтось може вказати мені на те, як обчислити основні осі багатокутника, це також було б мені корисно)

Заманливо просто виконати PCA на координатах , але при цьому виникає питання про те, що координати необов'язково рівномірно розподіляються навколо багатокутника, і тому не є репрезентативною щільністю багатокутника. Крайній приклад - контур Північної Дакоти, полігон якого визначається великою кількістю точок, що слідують за річкою Червона, плюс лише дві ще точки, що визначають західний край штату.

pca covariance-matrix polygon

— Інголіфи
джерело

Під «знаходженням» я припускаю, що просто відбирати пробу з багатокутника, а потім обчислювати коваріантність зразків - це не те, що ти маєш на увазі?

— Стефан Коласа

Також ви можете редагувати свою публікацію, щоб вона включала координати для вашого полігону, щоб люди могли пограти з ним?

— Стефан Коласа

@StephanKolassa Я маю на увазі трактування полігону як рівномірної двовимірної щільності ймовірності з полігональною межею. Звичайно, ви можете взяти вибірку балів, і межа буде те саме, але я шукаю апріорний метод. Малюнок - лише ілюстрація від фарби, яку я використав. Дані реального світу, які я маю намір використати, - це контури штатів та регіонів.

— Інголіфс

Ви вірні, що звичайний термін "матриці коваріації" - це інерційний момент або другий момент. Головні осі орієнтовані в її ейджендирекціях. Запуск PCA за координатами є некоректним: це рівносильно припускати, що вся маса розташована у вершинах. Найбільш прямі методи обчислення барицентру - перший момент - обговорюються в моєму пості на сайті gis.stackexchange.com/a/22744/664 . Другі моменти обчислюються так само з незначними модифікаціями. Потрібні особливі міркування щодо сфери.

— whuber

Це працює інакше: обчислити інерційний тензор і віднайти його основні осі. Метод у вашому випадку включає теорему Гріна, яка показує, що необхідні інтеграли

μ_{k, l} (P) = \iint_{P} x^{k} y^{l} d x d y

$\mu_{k,l}(\mathcal{P})=\iint_{\mathcal{P}}x^ky^l\mathrm{d}x\mathrm{d}y$ може бути обчислено як контурні інтеграли навколо в одній форми деТакі форми легко знайти, оскільки будь-яка відповідна лінійна комбінація і буде працювати. Контурний інтеграл - це сума інтегралів по краях.

\partial P

$\partial\mathcal{P}$

ω

$\omega$

d ω = x^{k} y^{l} d x d y .

$\mathrm{d}\omega=x^ky^l\mathrm{d}x\mathrm{d}y.$

x^{k} y^{l + 1} d x

$x^ky^{l+1}\mathrm{d}x$

x^{k + 1} y^{l} d y

$x^{k+1}y^l\mathrm{d}y$

— whuber

Відповіді:

Давайте спочатку зробимо деякий аналіз.

Припустимо, у полігоні його щільність ймовірності пропорційна функції Тоді константа пропорційності - обернена інтеграл над багатокутником, $\mathcal{P}$ $p(x,y).$ $p$

μ_{0, 0} (P) = \iint_{P} p (x, y) d x d y .

$\mu_{0,0}(\mathcal{P})=\iint_{\mathcal P} p(x,y) \mathrm{d}x\,\mathrm{d}y.$

Баріцентр багатокутника є точкою середніх координат, обчислених як їх перших моментів. Перший - це

μ_{1, 0} (P) = \frac{1}{μ_{0, 0} (P)} \iint_{P} x p (x, y) d x d y .

$\mu_{1,0}(\mathcal{P})=\frac{1}{\mu_{0,0}(\mathcal{P})} \iint_{\mathcal P} x\,p(x,y)\mathrm{d}x\,\mathrm{d}y.$

Тензор інерції може бути представлена в вигляді симетричній матриці других моментів , обчислених після перекладу багатокутника поставити свій баріцентр на початку координат: тобто матриця центральних моментів другого

μ_{k, l}^{'} (P) = \frac{1}{μ_{0, 0} (P)} \iint_{P} {(x - μ_{1, 0} (P))}^{k} {(y - μ_{0, 1} (P))}^{l} p (x, y) d x d y

$\mu^\prime_{k,l}(\mathcal{P}) = \frac{1}{\mu_{0,0}(\mathcal{P})} \iint_{\mathcal P} \left(x - \mu_{1,0}(\mathcal{P})\right)^k\,\left(y - \mu_{0,1}(\mathcal{P})\right)^l\,p(x,y)\mathrm{d}x\,\mathrm{d}y$

де варіюється від до до Тензор в тому : ака ковариационная матриця - це $(k,l)$ $(2,0)$ $(1,1)$ $(0,2).$

I (P) = (\begin{matrix} μ_{2, 0}^{'} (P) & μ_{1, 1}^{'} (P) \\ μ_{1, 1}^{'} (P) & μ_{0, 2}^{'} (P) \end{matrix}) .

$I(\mathcal{P}) = \pmatrix{\mu^\prime_{2,0}(\mathcal{P}) & \mu^\prime_{1,1}(\mathcal{P}) \\ \mu^\prime_{1,1}(\mathcal{P}) & \mu^\prime_{0,2}(\mathcal{P})}.$

РС з дає головну вісь з ці поодинокі власні вектори , масштабовані їх власних значень. $I(\mathcal{P})$ $\mathcal{P}:$

Далі давайте розберемося, як робити розрахунки. Оскільки багатокутник представлений у вигляді послідовності вершин, що описують його орієнтовану границю природно викликати $\partial\mathcal P,$

Теорема Гріна: де - одноформатна форма, визначена в сусідстві з і
$\iint_{P} d ω = \oint_{\partial P} ω$ $\iint_{\mathcal{P}} \mathrm{d}\omega = \oint_{\partial\mathcal{P}}\omega$ $\omega = M(x,y)\mathrm{d}x + N(x,y)\mathrm{d}y$ $\mathcal{P}$ $d ω = (\frac{\partial}{\partial x} N (x, y) - \frac{\partial}{\partial y} M (x, y)) d x d y .$ $\mathrm{d}\omega = \left(\frac{\partial}{\partial x}N(x,y) - \frac{\partial}{\partial y}M(x,y)\right)\mathrm{d}x\,\mathrm{d}y.$

Наприклад, з та постійною ( тобто рівномірною) щільністю ми можемо (за допомогою перевірки) вибрати одну з багатьох рішення, такі як $\mathrm{d}\omega = x^k y^l \mathrm{d}x\mathrm{d}y$ $p,$

ω (x, y) = \frac{- 1}{l + 1} x^{k} y^{l + 1} d x .

$\omega(x,y) = \frac{-1}{l+1}x^k y^{l+1}\mathrm{d}x.$

Сенс цього полягає в тому, що контурний інтеграл слідує за відрізками ліній, визначених послідовністю вершин. Будь-який відрізок рядка від вершини до вершини може бути параметризований реальною змінною у вигляді $\mathbf{u}$ $\mathbf{v}$ $t$

t \to u + t w

$t \to \mathbf{u} + t\mathbf{w}$

де є одиничним нормальним напрямком від доЗначення тому варіюються від до При цій параметризації і є лінійними функціями і а є лінійними функціями Таким чином, підінтегральна інтеграла контуру над кожним ребром стає поліноміальна функція від яке легко обчислюються при малих і $\mathbf{w} \propto \mathbf{v}-\mathbf{u}$ $\mathbf{u}$ $\mathbf{v}.$ $t$ $0$ $|\mathbf{v}-\mathbf{u}|.$ $x$ $y$ $t$ $\mathrm{d}x$ $\mathrm{d}y$ $\mathrm{d}t.$ $t,$ $k$ $l.$

Реалізація цього аналізу настільки ж проста, як і кодування його компонентів. На найнижчому рівні нам знадобиться функція інтегрувати одночлен многочлена над відрізком лінії. Функції вищого рівня об'єднають їх для обчислення сирих та центральних моментів для отримання барицентра та інерційного тензору, і, нарешті, ми можемо діяти на цьому тензорі, щоб знайти основні осі (які є його масштабованими власними векторами). RНижче код виконує цю роботу. Це не робить претензій на ефективність: він призначений лише для ілюстрації практичного застосування попереднього аналізу. Кожна функція є прямолінійною, а конвенції про іменування паралельно виконуючи аналіз.

В код включена процедура генерації дійсних замкнених, просто з'єднаних, непересічних багатокутників (випадковим чином деформуючи точки вздовж кола і включаючи стартову вершину як свою кінцеву точку для створення замкнутого циклу). Слідом за цим є кілька тверджень про побудову полігона, відображення його вершин, примикання до барицентра та побудова основних головних осей червоним (найбільшим) та синім (найменшим), створюючи позитивно орієнтовану позитивно орієнтовану систему координат.

#
# Integrate a monomial one-form x^k*y^l*dx along the line segment given as an 
# origin, unit direction vector, and distance.
#
lintegrate <- function(k, l, origin, normal, distance) {
  # Binomial theorem expansion of (u + tw)^k
  expand <- function(k, u, w) {
    i <- seq_len(k+1)-1
    u^i * w^rev(i) * choose(k,i)
  }
  # Construction of the product of two polynomials times a constant.
  omega <- normal[1] * convolve(rev(expand(k, origin[1], normal[1])), 
                                expand(l, origin[2], normal[2]),
                                type="open")
  # Integrate the resulting polynomial from 0 to `distance`.
  sum(omega * distance^seq_along(omega) / seq_along(omega))
}
#
# Integrate monomials along a piecewise linear path given as a sequence of
# (x,y) vertices.
#
cintegrate <- function(xy, k, l) {
  n <- dim(xy)[1]-1 # Number of edges
  sum(sapply(1:n, function(i) {
    dv <- xy[i+1,] - xy[i,]               # The direction vector
    lambda <- sum(dv * dv)
    if (isTRUE(all.equal(lambda, 0.0))) {
      0.0
    } else {
      lambda <- sqrt(lambda)              # Length of the direction vector
      -lintegrate(k, l+1, xy[i,], dv/lambda, lambda) / (l+1)
    }
  }))
}
#
# Compute moments of inertia.
#
inertia <- function(xy) {
  mass <- cintegrate(xy, 0, 0)
  barycenter = c(cintegrate(xy, 1, 0), cintegrate(xy, 0, 1)) / mass
  uv <- t(t(xy) - barycenter)   # Recenter the polygon to obtain central moments
  i <- matrix(0.0, 2, 2)
  i[1,1] <- cintegrate(uv, 2, 0)
  i[1,2] <- i[2,1] <- cintegrate(uv, 1, 1)
  i[2,2] <- cintegrate(uv, 0, 2)
  list(Mass=mass,
       Barycenter=barycenter,
       Inertia=i / mass)
}
#
# Find principal axes of an inertial tensor.
#
principal.axes <- function(i.xy) {
  obj <- eigen(i.xy)
  t(t(obj$vectors) * obj$values)
}
#
# Construct a polygon.
#
circle <- t(sapply(seq(0, 2*pi, length.out=11), function(a) c(cos(a), sin(a))))
set.seed(17)
radii <- (1 + rgamma(dim(circle)[1]-1, 3, 3))
radii <- c(radii, radii[1])  # Closes the loop
xy <- circle * radii
#
# Compute principal axes.
#
i.xy <- inertia(xy)
axes <- principal.axes(i.xy$Inertia)
sign <- sign(det(axes))
#
# Plot barycenter and principal axes.
#
plot(xy, bty="n", xaxt="n", yaxt="n", asp=1, xlab="x", ylab="y",
     main="A random polygon\nand its principal axes", cex.main=0.75)
polygon(xy, col="#e0e0e080")
arrows(rep(i.xy$Barycenter[1], 2), 
       rep(i.xy$Barycenter[2], 2),
       -axes[1,] + i.xy$Barycenter[1],     # The -signs make the first axis .. 
       -axes[2,]*sign + i.xy$Barycenter[2],# .. point to the right or down.
       length=0.1, angle=15, col=c("#e02020", "#4040c0"), lwd=2)
points(matrix(i.xy$Barycenter, 1, 2), pch=21, bg="#404040")

— дзижчати
джерело

+1 Вау, це чудова відповідь!

— амеба

Редагувати: Не помітили, що Валер уже відповів. Я залишу це на прикладі іншого (можливо, менш елегантного) підходу до проблеми.

Коваріаційна матриця

Нехай випадкова точка з рівномірного розподілу на багатокутник з площею . Коваріаційна матриця: $(X,Y)$ $P$ $A$

C = [\begin{matrix} C_{X X} & C_{X Y} \\ C_{X Y} & C_{Y Y} \end{matrix}]

$C = \begin{bmatrix} C_{XX} & C_{XY} \\ C_{XY} & C_{YY} \end{bmatrix}$

де - дисперсія , - дисперсія , а - коваріація між і . Це передбачає нульову середню, оскільки центр маси полігона розташований біля початку. Рівномірний розподіл призначає постійну густину ймовірностей кожній точці , так що: $C_{XX} = E[X^2]$ $X$ $C_{YY} = E[Y^2]$ $Y$ $C_{XY} = E[XY]$ $X$ $Y$ $\frac{1}{A}$ $P$

\begin{matrix} (1) & C_{X X} = \frac{1}{A} \iint_{P} x^{2} d V C_{Y Y} = \frac{1}{A} \iint_{P} y^{2} d V C_{X Y} = \frac{1}{A} \iint_{P} x y d V \end{matrix}

$C_{XX} = \frac{1}{A} \underset{P}{\iint} x^2 dV \quad C_{YY} = \frac{1}{A} \underset{P}{\iint} y^2 dV \quad C_{XY} = \frac{1}{A} \underset{P}{\iint} x y dV \tag{1}$

Тріангуляція

Замість того, щоб намагатися безпосередньо інтегруватись у складну область типу , ми можемо спростити проблему, розділивши на трикутних субрегіонів: $P$ $P$ $n$

P = T_{1} \cup \dots \cup T_{n}

$P = T_1 \cup \cdots \cup T_n$

У вашому прикладі один з можливих розділів виглядає так:

Існують різні способи отримання тріангуляції (див. Тут ). Наприклад, можна обчислити триангуляцію вершин Делоне , а потім відкинути ребра, що виходять за межі (оскільки це може бути невипуклим, як у прикладі). $P$

Інтеграли над можуть бути розбиті на суми інтегралів над трикутниками: $P$

\begin{matrix} (2) & C_{X X} = \frac{1}{A} \sum_{i = 1}^{n} \iint_{T_{i}} x^{2} d V C_{Y Y} = \frac{1}{A} \sum_{i = 1}^{n} \iint_{T_{i}} y^{2} d V C_{X Y} = \frac{1}{A} \sum_{i = 1}^{n} \iint_{T_{i}} x y d V \end{matrix}

$C_{XX} = \frac{1}{A} \sum_{i=1}^n \underset{T_i}{\iint} x^2 dV \quad C_{YY} = \frac{1}{A} \sum_{i=1}^n \underset{T_i}{\iint} y^2 dV \quad C_{XY} = \frac{1}{A} \sum_{i=1}^n \underset{T_i}{\iint} x y dV \tag{2}$

У трикутника є приємні, прості межі, тому ці інтеграли оцінити легше.

Інтегрування через трикутники

Існують різні способи інтеграції через трикутники. У цьому випадку я використав трюк, який передбачає відображення трикутника до одиничного квадрата. Перетворення в барицентричні координати може бути кращим варіантом.

Ось рішення інтегралів, наведених вище, для довільного трикутника визначеного вершинами . Дозволяє: $T$ $(x_1,y_1), (x_2,y_2), (x_3,y_3)$

v_{x} = [\begin{matrix} x_{1} \\ x_{2} \\ x_{3} \end{matrix}] v_{y} = [\begin{matrix} y_{1} \\ y_{2} \\ y_{3} \end{matrix}] \vec{1} = [\begin{matrix} 1 \\ 1 \\ 1 \end{matrix}] L = [\begin{matrix} 1 & 0 & 0 \\ 1 & 1 & 0 \\ 1 & 1 & 1 \end{matrix}]

$v_x = \left[ \begin{smallmatrix} x_1 \\ x_2 \\ x_3 \end{smallmatrix} \right] \quad v_y = \left[ \begin{smallmatrix} y_1 \\ y_2 \\ y_3 \end{smallmatrix} \right] \quad \vec{1} = \left[ \begin{smallmatrix} 1 \\ 1 \\ 1 \end{smallmatrix} \right] \quad L = \left[ \begin{smallmatrix} 1 & 0 & 0 \\ 1 & 1 & 0 \\ 1 & 1 & 1 \end{smallmatrix} \right]$

Тоді:

\begin{matrix} (3) & \iint_{T} x^{2} d V = \frac{A}{6} Tr (v_{x} v_{x}^{T} L) \iint_{T} y^{2} d V = \frac{A}{6} Tr (v_{y} v_{y}^{T} L) \iint_{T} x y d V = \frac{A}{12} ({\vec{1}}^{T} v_{x} v_{y}^{T} \vec{1} + v_{x}^{T} v_{y}) \end{matrix}

$\underset{T}{\iint} x^2 dV = \frac{A}{6} \text{Tr}(v_x v_x^T L) \quad \underset{T}{\iint} y^2 dV = \frac{A}{6} \text{Tr}(v_y v_y^T L) \quad \underset{T}{\iint} x y dV = \frac{A}{12} (\vec{1}^T v_x v_y^T \vec{1} + v_x^T v_y) \tag{3}$

Збираючи все разом

Нехай і містять координати x / y вершин для кожного трикутника , як зазначено вище. Підключіть до для кожного трикутника, зазначивши, що умови площі скасовуються. Це дає рішення: $v_x^i$ $v_y^i$ $T_i$ $(3)$ $(2)$

\begin{matrix} (4) & C_{X X} = \frac{1}{6} \sum_{i = 1}^{n} Tr (v_{x}^{i} (v_{x}^{i})^{T} L) C_{Y Y} = \frac{1}{6} \sum_{i = 1}^{n} Tr (v_{y}^{i} (v_{y}^{i})^{T} L) C_{X Y} = \frac{1}{12} \sum_{i = 1}^{n} ({\vec{1}}^{T} v_{x}^{i} (v_{y}^{i})^{T} \vec{1} + (v_{x}^{i})^{T} v_{y}^{i}) \end{matrix}

$C_{XX} = \frac{1}{6} \sum_{i=1}^n \text{Tr} \big( v_x^i (v_x^i)^T L \big) \quad C_{YY} = \frac{1}{6} \sum_{i=1}^n \text{Tr} \big( v_y^i (v_y^i)^T L \big) \quad C_{XY} = \frac{1}{12} \sum_{i=1}^n \big( \vec{1}^T v_x^i (v_y^i)^T \vec{1} + (v_x^i)^T v_y^i \big) \tag{4}$

Основні осі

Основні осі задаються власними векторами матриці коваріації , як і в PCA. На відміну від PCA, ми маємо аналітичний вираз для , а не для того, щоб оцінювати його з вибіркових точок даних. Зауважимо, що самі вершини не є репрезентативним вибірком з рівномірного розподілу на , тому не можна просто взяти вибіркову коваріаційну матрицю вершин. Але, * є * відносно проста функція вершин, як видно в . $C$ $C$ $P$ $C$ $(4)$

— користувач20160
джерело

+1 Це можна спростити, якщо дозволити орієнтовані трикутники, тим самим виключивши потребу в правильній тріангуляції. Натомість ви можете просто встановити довільний центр та підсумувати (підписані) значення за трикутниками саме так це часто робиться, тому що він набагато менш метушливий. Неважко помітити, що таке підсумовування є по суті тим же, що і застосування теореми Гріна, оскільки кожен доданок у підсумовуванні в кінцевому підсумку є функцією краюТакий підхід проілюстровано в розділі "Область" на веб- сайті Quantdec.com/SYSEN597/GTKAV/section2/chapter_11.htm .

O

$O$

O P_{i} P_{i + 1} :

$OP_iP_{i+1}:$

P_{i} P_{i + 1} .

$P_iP_{i+1}.$

— whuber

@whuber Цікаво, дякую, що вказали на це

— user20160

Обидві ці відповіді хороші, хоча і трохи перевищують рівень моєї освіти. Коли я впевнений, що я їх повністю розумію, я спробую розібратися, хто отримує виграш.

— Інголіфс