Як знайти очікувану відстань між двома рівномірно розподіленими точками?


9

Якби я визначив координати і де(X1,Y1)(X2,Y2)

X1,X2Unif(0,30) and Y1,Y2Unif(0,40).

Як я можу знайти очікуване значення відстані між ними?

Я думав, оскільки відстань обчислюється буде очікуваним значенням просто бути ?(X1X2)2+(Y1Y2)2)(1/30+1/30)2+(1/40+1/40)2


Ваш код LaTeX відображався неправильно. Я сподіваюсь, що моя помилка - це те, що ви планували
Пітер Флом

Майже, але це допомогло мені потрапити туди, врешті-решт, велике спасибі.
Mathlete

2
Еквівалентне запитання на сайті математики: Середня відстань між випадковими точками у прямокутнику . Пов'язане питання: Ймовірність того, що рівномірно випадкові точки у прямокутнику мають евклідову відстань менше заданого порогу . (На жаль, мені ніколи не доводилося братися до @whuber щодо його пропозицій. Спробую знайти час для цього.)
кардинал

1
Дякую за ці посилання, @cardinal. Хоча математична версія не пояснює відповідь - вона просто її представляє - вона містить посилання на одне виведення, яке варто переглянути.
whuber

Відповіді:


2
##problem
x <- runif(1000000,0,30)
y <- runif(1000000,0,40)
Uniform <- as.data.frame(cbind(x,y))
n <- nrow(Uniform)
catch <- rep(NA,n)
for (i in 2:n) {
      catch[i] <-((x[i+1]-x[i])^2 + (y[i+1]-y[i])^2)^.5
}
mean(catch, na.rm=TRUE)
18.35855

Якщо я правильно зрозумів, що ви шукаєте, можливо, це допоможе. Ви намагаєтеся визначити відстань до випадкових точок, у яких значення X породжуються з unif (0,30), а значення Y породжуються з unif (0,40). Я щойно створив мільйон RV з кожного з них на розподіли, а потім зв'язав x і y, щоб створити крапку для кожного з них. Тоді я обчислював відстань між точкою 2 і 1 аж до відстані між точками 1 000 000 і 999 999. Середня відстань становила 18,35855. Дайте мені знати, якщо це не те, що ви шукали.


Взяв на себе право редагування для форматування.
curious_cat

2
Ви підійшли досить близько - можливо, випадково. Справжня відповідь - = . Ваш код має дві проблеми: (1) ітерації не є взаємно незалежними; і (2) щоб отримати розумну точність, його слід кодувати, щоб бути швидшим. Чому б не зробити моделювання безпосередньо, як в . Це дозволить отримати приблизно чотири значущі цифри (за менший час), як ви можете перевірити, обчисливши стандартну помилку . 1108(871+960log(2)+405log(3))18.345919n <- 10^7; distance <- sqrt((runif(n,0,30)-runif(n,0,30))^2 + (runif(n,0,40)-runif(n,0,40))^2)sd(distance) / sqrt(n)
whuber

@whuber: Ви можете пояснити свій номер 1? наприклад, скажімо (Case-I), я намалював пари випадкових чисел з будь-якого заданого розподілу та обчислив різниці і взяв середнє значення. Versus (Case-II) Я продовжував малювати по одному цифру за раз і продовжував обчислювати різницю бігу відносно останнього розіграшу числа та потім усереднював. Чи систематично відрізнятимуться середні показники, повідомлені у справі "І" та "Справа II"?
curious_cat

1
@curious_cat Ні, середні значення були б приблизно однаковими: але розрахунок стандартної помилки був би іншим. Цей розрахунок нам потрібен для того, щоб оцінити, наскільки близьке середнє значення може прийти до справжнього значення. Замість того, щоб опрацювати складніший підрахунок SE, простіше просто сформувати пари точок повністю незалежно одна від одної, точно так, як це передбачено у питанні. (Є так багато способів моделювання може піти не так - я знаю з досвіду! - що розумно зробити симуляцію імітувати реальність якомога ближче.)
whuber

@whuber: Дякую за уточнення. Отже, якби Кларк довше керував кодом, він міг би отримати більше десяткових знаків, чи не так?
curious_cat

16

Зрозуміло, що, дивлячись на питання геометрично, очікувана відстань між двома незалежними, рівномірними, випадковими точками в межах опуклої множини буде трохи менше половини її діаметра . (Це повинно бути менше, оскільки порівняно рідко обидві точки розташовуються в екстремальних областях, таких як кути, і частіше бувають, що вони будуть поблизу центру, де вони знаходяться близько.) Оскільки діаметр цього прямокутника дорівнює , По суті, міркуємо, що відповідь буде менше .5025

Точну відповідь отримуємо з визначення очікування як значення, зваженого на ймовірність відстані. Взагалі розглянемо прямокутник сторін і ; ми будемо масштабувати його до потрібного розміру після цього (встановивши і помноживши очікування на ). Для цього прямокутника, використовуючи координати , рівномірна щільність ймовірності дорівнює . Середня відстань у цьому прямокутнику тоді задається через1λλ=40/3030(x,y)1λdxdy

0λ010λ01(x1x2)2+(y1y2)21λdx1dy11λdx2dy2.

З використанням елементарних методів інтеграції це просто, але болісно; Для отримання відповіді я застосував систему комп’ютерної алгебри ( Mathematica )

[2+2λ521+λ2+6λ21+λ22λ41+λ2+5λArcSinh(λ)+5λ4log(1+1+λ2λ)]/(30λ2).

Наявність у багатьох із цих термінів не дивно: це діаметр прямокутника (максимально можлива відстань між будь-якими двома точками всередині нього). Поява логарифмів (до яких належить арссінь) також не дивно, якщо ви коли-небудь досліджували середні відстані в простих площинах: якось це завжди відображається (натяк на це з'являється в інтегралі семантичної функції). Між іншим, присутність в знаменнику не має нічого спільного зі специфікою проблеми, що стосується прямокутника сторін і : це універсальна константа.)1+λ2303040

З та збільшення масштабу на коефіцієнт , це оцінюється до .λ=4/3301108(871+960log(2)+405log(3))18.345919


Один із способів глибше зрозуміти ситуацію - побудувати графік середньої відстані відносно діаметра для різних значень . Для крайніх значень (близько або набагато більше, ніж ) прямокутник стає по суті одновимірним, а більш елементарна інтеграція вказує, що середнє відстань має зменшитись до третини діаметра. Крім того, оскільки форми прямокутників з та однакові, закономірно результат будувати за логарифмічною шкалою , де він повинен бути симетричним щодо (квадрат). Ось:1+λ2λ01λ1/λλλ=1

Сюжет

Завдяки цьому ми дізнаємося велике правило : середня відстань у прямокутнику становить від та (приблизно) його діаметра, причому великі значення пов'язані з квадратичними прямокутниками та менші значення, пов'язані з довгими худими (лінійними) ) прямокутники. Середина між цими крайностями досягається приблизно для прямокутників із співвідношенням сторін . Маючи на увазі це правило, ви можете просто подивитися на прямокутник і оцінити його середню відстань до двох значущих фігур.1/30.330.373:1


Це має бути "діагональне" замість "діаметра"? Вибачте, якщо я випиваю.
curious_cat

@curious_cat За визначенням, діаметр набору точок (у будь-якому метричному просторі) є надсумою відстаней між будь-якими двома точками в ньому. Для прямокутника це (очевидно) довжина діагоналі.
whuber

Дякую! Я цього не усвідомлював. Я використовував наївну концепцію діаметра.
curious_cat

Як бік: Для всіх прямокутників даної площі було б мінімізовано середню відстань для квадрата?
curious_cat

2
В дусі цього я хочу, щоб ви почали цю відповідь із "Це літак ..." (+1)
кардинал
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.