Ефективно створюйте точки між одиничним колом та одиницею квадрата

Я б хотів генерувати зразки з блакитної області, визначеної тут:

Наївним рішенням є використання відбору проб відхилення в одиничному квадраті, але це забезпечує лише ефективність (~ 21,4%). $1-\pi/4$

Чи є якийсь спосіб я можу зробити вибірку більш ефективно?

— Cam.Davidson.Pilon
джерело

Підказка : Використовуйте симетрію, щоб трівіально подвоїти ефективність.

— кардинал

О як: якщо значення дорівнює (0,0), це можна відобразити в (1,1)? Мені подобається ця ідея

— Cam.Davidson.Pilon

@cardinal Чи не повинен це 4 рази ефективність? Ви можете взяти вибірку в

а потім відобразити її по осі x, y-осі та походження.

[0, \dots, 1] \times [0, \dots, 1]

$[0,\ldots,1] \times [0,\ldots,1]$

— Мартін Кремер

@Martin: У чотирьох симетричних областях у вас перекриття, з якими вам доведеться поводитися більш ретельно.

— кардинал

@Martin: Якщо я зрозуміти , що ви описуєте, що ні призводить до підвищення ефективності на всіх . (Ви знайшли одну точку, і тепер знаєте три інші --- в області, що в чотири рази перевищує розмір ---, які або роблять, або не лежать в одиничному диску з імовірністю один відповідно до того, чи

робить. це допомагає?) Точка підвищення ефективності полягає у збільшенні ймовірності прийняття для кожного

породженого. Можливо, я той, хто щільний?

(x, y)

$(x,y)$

(x, y)

$(x,y)$

— кардинал

Відповіді:

Зроблять два мільйони очок за секунду?

Розподіл симетричний: нам потрібно лише розробити розподіл на одну восьму повного кола, а потім скопіювати його навколо інших октантів. У полярних координатах кумулятивний розподіл кута для випадкового розташування при значенні задається площею між трикутником і дуга кола, що проходить від $(r,\theta)$ $\Theta$ $(X,Y)$ $\theta$ $(0,0), (1,0), (1,\tan\theta)$ до . Таким чином, він пропорційний $(1,0)$ $(\cos\theta,\sin\theta)$

F_{Θ} (θ) = Pr (Θ \leq θ) \propto \frac{1}{2} \tan (θ) - \frac{θ}{2},

$F_\Theta(\theta) = \Pr(\Theta \le \theta) \propto \frac{1}{2}\tan(\theta) - \frac{\theta}{2},$

звідки його щільність

f_{Θ} (θ) = \frac{d}{d θ} F_{Θ} (θ) \propto \tan^{2} (θ) .

$f_\Theta(\theta) = \frac{d}{d\theta} F_\Theta(\theta) \propto \tan^2(\theta).$

Ми можемо вибірку з цієї щільності, використовуючи, скажімо, метод відкидання (який має ефективність ). $8/\pi-2 \approx 54.6479\%$

Умовна щільність радіальної координати пропорційна між та . Це можна пробити за допомогою легкої інверсії CDF. $R$ $rdr$ $r=1$ $r=\sec\theta$

Якщо ми генеруємо незалежні зразки , перетворення назад до декартових координат вибірки цього октанта. Оскільки вибірки є незалежними, випадкове зміна координат створює незалежну випадкову вибірку з першого квадранта, як бажано. (Випадкові свопи вимагають генерування лише однієї біноміальної змінної, щоб визначити, скільки реалізується для заміни.) $(r_i,\theta_i)$ $(x_i,y_i)$

Кожна така реалізація вимагає, в середньому, однієї рівномірної змінної (для ) плюс разів двох рівномірних змінних (для ) і невеликої кількості (швидкого) обчислення. Це змінних на точку (що, звичайно, має дві координати). Повна інформація наведена в прикладі коду нижче. Ця цифра відображає 10 000 з більш ніж півмільйона отриманих балів. $(X,Y)$ $R$ $1/(8\pi-2)$ $\Theta$ $4/(\pi-4) \approx 4.66$

Ось Rкод, який створив це моделювання та приуротив його.

n.sim <- 1e6
x.time <- system.time({
  # Generate trial angles `theta`
  theta <- sqrt(runif(n.sim)) * pi/4
  # Rejection step.
  theta <- theta[runif(n.sim) * 4 * theta <= pi * tan(theta)^2]
  # Generate radial coordinates `r`.
  n <- length(theta)
  r <- sqrt(1 + runif(n) * tan(theta)^2)
  # Convert to Cartesian coordinates.
  # (The products will generate a full circle)
  x <- r * cos(theta) #* c(1,1,-1,-1)
  y <- r * sin(theta) #* c(1,-1,1,-1)
  # Swap approximately half the coordinates.
  k <- rbinom(1, n, 1/2)
  if (k > 0) {
    z <- y[1:k]
    y[1:k] <- x[1:k]
    x[1:k] <- z
  }
})
message(signif(x.time[3] * 1e6/n, 2), " seconds per million points.")
#
# Plot the result to confirm.
#
plot(c(0,1), c(0,1), type="n", bty="n", asp=1, xlab="x", ylab="y")
rect(-1, -1, 1, 1, col="White", border="#00000040")
m <- sample.int(n, min(n, 1e4))
points(x[m],y[m], pch=19, cex=1/2, col="#0000e010")

— дзижчати
джерело

Я не розумію цього речення: "Оскільки вибірки є незалежними, систематично змінюючи координати, кожен другий зразок виробляє незалежну випадкову вибірку з першого квадранта за бажанням". Мені здається, що систематично міняючи координати, кожен другий зразок виробляє високозалежні вибірки. Наприклад, мені здається, що ваша реалізація в коді генерує півмільйона зразків поспіль з одного октанта?

— А. Рекс

Власне кажучи, такий підхід не дуже працює (для балів в iid), оскільки він генерує однакову кількість зразків у двох октантах: Таким чином, точки вибірки залежать. Тепер, якщо ви перегортаєте неупереджені монети, щоб визначити октант для кожного зразка ...

— кардинал

@Cardinal ви маєте рацію; Я це виправлю - без (асимптотично) збільшення кількості випадкових змінних для генерації!

— whuber

Власне кажучи (і, знову ж таки, лише в чистому теоретичному сенсі), у випадку кінцевої вибірки ваша модифікація не потребує додаткових рівномірних випадкових величин. На розум: З першої рівномірної випадкової величини побудуйте гортаючу послідовність з перших

біт. Потім використовуйте решту (раз

) в якості першої згенерованої координати.

n

$n$

2^{n}

$2^n$

— кардинал

@ Xi'an мені не вдалося отримати зручно обчислену інверсію. Я можу зробити трохи краще, відкинувши вибірку від розподілу з щільністю, пропорційною

(ефективність

), ціною необхідності обчислити аркусин .

2 \sin (θ)^{2}

$2\sin(\theta)^2$

(4 - π) / (π - 2) \approx 75 %

$(4-\pi)/(\pi-2)\approx 75\%$

— whuber

Я пропоную наступне рішення, яке повинно бути простішим, ефективнішим та / або обчислювально дешевшим, ніж інші соуси від @cardinal, @whuber та @ stephan-kolassa поки що.

Він включає наступні прості кроки:

u_{1} \sim U n i f (0, 1) u_{2} \sim U n i f (0, 1) .

$u_1 \sim Unif(0,1)\\ u_2 \sim Unif(0,1).$

$\min\{u_1,u_2\}, \max\{u_1,u_2\}$

[\begin{matrix} x \\ y \end{matrix}] = [\begin{matrix} 1 \\ 1 \end{matrix}] + [\begin{matrix} \frac{\sqrt{2}}{2} & - 1 \\ \frac{\sqrt{2}}{2} - 1 & 0 \end{matrix}] [\begin{matrix} min {u_{1}, u_{2}} \\ max {u_{1}, u_{2}} \end{matrix}] .

$\begin{bmatrix} x\\y \end{bmatrix} = \begin{bmatrix} 1\\1 \end{bmatrix} + \begin{bmatrix} \frac{\sqrt{2}}{2} & -1\\ \frac{\sqrt{2}}{2} - 1 & 0\\ \end{bmatrix} \, \begin{bmatrix} \min\{u_1,u_2\}\\ \max\{u_1,u_2\}\\ \end{bmatrix}.$

$x$ $y$ $u_1 > u_2$

x^{2} + y^{2} < 1.

$x^2 + y^2 < 1.$

Інтуїція, що стоїть за цим алгоритмом, показана на малюнку.

Кроки 2a та 2b можна об'єднати в один крок:

x = 1 + \frac{\sqrt{2}}{2} min (u_{1}, u_{2}) - u_{2} y = 1 + \frac{\sqrt{2}}{2} min (u_{1}, u_{2}) - u_{1}

$x = 1 + \frac{\sqrt{2}}{2} \min(u_1, u_2) - u_2\\ y = 1 + \frac{\sqrt{2}}{2} \min(u_1, u_2) - u_1$

Наступний код реалізує алгоритм, наведений вище (і тестує його за допомогою коду @ whuber).

n.sim <- 1e6
x.time <- system.time({
    # Draw two standard uniform samples
    u_1 <- runif(n.sim)
    u_2 <- runif(n.sim)
    # Apply shear transformation and swap
    tmp <- 1 + sqrt(2)/2 * pmin(u_1, u_2)
    x <- tmp - u_2
    y <- tmp - u_1
    # Reject if inside circle
    accept <- x^2 + y^2 > 1
    x <- x[accept]
    y <- y[accept]
    n <- length(x)
})
message(signif(x.time[3] * 1e6/n, 2), " seconds per million points.")
#
# Plot the result to confirm.
#
plot(c(0,1), c(0,1), type="n", bty="n", asp=1, xlab="x", ylab="y")
rect(-1, -1, 1, 1, col="White", border="#00000040")
m <- sample.int(n, min(n, 1e4))
points(x[m],y[m], pch=19, cex=1/2, col="#0000e010")

Деякі швидкі тести дають такі результати.

Алгоритм /stats//a/258349 . Найкраще 3: 0,33 секунди на мільйон очок.

Цей алгоритм. Найкраще 3: 0,18 секунди на мільйон очок.

— Лука Сіті
джерело

+1 Дуже добре! Дякуємо, що поділилися продуманим, розумним та простим рішенням.

— whuber

Чудова ідея! Я думав про відображення від одиниці кв до цієї частини, але не думав про недосконале відображення, а потім про схему відхилення. Дякую за те, що я розширив свою думку!

— Cam.Davidson.Pilon

Що ж, ефективніше можна зробити, але я впевнений, що ви швидше не шукаєте .

$x$ $x$

f (x) = 1 - \sqrt{1 - x^{2}} .

$f(x) = 1-\sqrt{1-x^2}.$

Wolfram допомагає вам інтегрувати це :

\int_{0}^{x} f (y) d y = - \frac{1}{2} x \sqrt{1 - x^{2}} + x - \frac{1}{2} \arcsin x .

$\int_0^x f(y)dy = -\frac{1}{2}x\sqrt{1-x^2}+x-\frac{1}{2}\arcsin x.$

$F$ $\int_0^1 f(y)dy$

$x$ $t$ $0$ $1$ $x$ $F(x)=t$

Нарешті, дано $x$ , виберіть випадковий $y$ що рівномірно розподілено між собою $\sqrt{1-x^2}$ і $1$ .

Нижче наведено код R. Зауважте, що я попередньо оцінював CDF в сітці $x$ значення, і навіть тоді це займає досить декількох хвилин.

Напевно, ви можете трохи прискорити інверсію CDF, якщо вкладете трохи думок. Потім знову мислення боляче. Я особисто хотів би взяти вибірку відхилень, що швидше і набагато менш схильне до помилок, якщо б у мене не було дуже вагомих причин цього не робити.

epsilon <- 1e-6
xx <- seq(0,1,by=epsilon)
x.cdf <- function(x) x-(x*sqrt(1-x^2)+asin(x))/2
xx.cdf <- x.cdf(xx)/x.cdf(1)

nn <- 1e4
rr <- matrix(nrow=nn,ncol=2)
set.seed(1)
pb <- winProgressBar(max=nn)
for ( ii in 1:nn ) {
    setWinProgressBar(pb,ii,paste(ii,"of",nn))
    x <- max(xx[xx.cdf<runif(1)])
    y <- runif(1,sqrt(1-x^2),1)
    rr[ii,] <- c(x,y)
}
close(pb)

plot(rr,pch=19,cex=.3,xlab="",ylab="")

— С. Коласа - Відновлення Моніки
джерело

Цікаво, чи використання поліномів Чебишева для наближення CDF покращило б швидкість оцінки.

— Sycorax каже, що повернеться до Моніки

@Sycorax, не без модифікацій; див., наприклад, хебфун-лікування алгебраїчних особливостей у кінцевих точках.

— JM не є статистиком