Розподіл та варіація підрахунку трикутників у випадковому графіку


10

Розглянемо випадковий графік Ердоса-Рені . Множина вершин позначена . Сукупність ребер побудована випадковим процесом.n V V = { 1 , 2 , , n } EG=(V(n),E(p))nVV={1,2,,n}E

Нехай - ймовірність , тоді кожна невпорядкована пара вершин ( ) виникає як ребро в з вірогідністю , незалежно від інших пар.0 < p < 1 { i , j } i j E pp0<p<1{i,j}ijEp

Трикутник у - це не упорядкована потрійна різних вершин, таких що , і є ребрами в .{ i , j , k } { i , j } { j , k } { k , i } GG{i,j,k}{i,j}{j,k}{k,i}G

Максимальна кількість можливих трикутників - (n3) . Визначимо випадкову величину X , щоб бути спостережуваний рахунок трикутників в графі G .

Ймовірність того, що одночасно присутні три ланки, є p3 . Тому очікуване значення X задається E(X)=(n3)p3 . Наївно можна здогадатися, що дисперсію задає E(X2)=(n3)p3(1p3) , але це не так.

Наступний код Mathematica моделює проблему:

n=50;
p=0.6;
t=100;
myCounts=Table[Length[FindCycle[RandomGraph[BernoulliGraphDistribution[n,p]],3,All]],{tt,1,t}];
N[Mean[myCounts]] // 4216. > similar to expected mean
Binomial[n,3]p^3 // 4233.6
N[StandardDeviation[myCounts]] // 262.078 > not similar to "expected" std
Sqrt[Binomial[n,3](p^3)(1-p^3)] // 57.612
Histogram[myCounts]

Яка дисперсія X ?

Відповіді:


4

Нехай iff утворює трикутник. Тоді і кожен . Це те, що ви використали для обчислення очікуваного значення.Yijk=1{i,j,k}X=i,j,kYijkYijkBernoulli(p3)

Щодо варіації, питання полягає в тому, що не є незалежними. Дійсно, запишіть Нам потрібно обчислити , яка є ймовірністю наявності обох трикутників. Є кілька випадків:Yijk

X2=i,j,ki,j,kYijkYijk.
E[YijkYijk]
  • Якщо (ті самі 3 вершини), то . Буде таких доданків у подвійній сумі.{i,j,k}={i,j,k}E[YijkYijk]=p3(n3)
  • Якщо множини і мають рівно два елемента спільно, то для отримання двох трикутників нам потрібно 5 ребер, щоб . в сумі буде .{i,j,k}{i,j,k}E[YijkYijk]=p512(n4)
  • Якщо множини і мають один спільний елемент, тоді нам потрібно 6 ребер, так що . У сумі буде .{i,j,k}{i,j,k}E[YijkYijk]=p630(n5)
  • Якщо множини і мають 0 спільних елементів, тоді нам потрібно 6 ребер, так що . У сумі буде .{i,j,k}{i,j,k}E[YijkYijk]=p620(n6)

Щоб переконатися, що ми охопили всі випадки, зауважте, що сума дорівнює .(n3)2

(n3)+12(n4)+30(n5)+20(n6)=(n3)2

Пам'ятаючи, щоб відняти квадрат очікуваного середнього, склавши це все разом, можна отримати:

E[X2]E[X]2=(n3)p3+12(n4)p5+30(n5)p6+20(n6)p6(n3)2p6

Використовуючи ті ж числові значення, що і ваш приклад, наступний код R обчислює стандартне відхилення, що досить близьке до значення 262 від вашого моделювання.

n=50
p=0.6
sqrt(choose(n, 3)*p^3+choose(n, 2)*(n-2)*(n-3)*p^5+(choose(n, 3)*choose(n-3, 3)+n*choose(n-1, 2)*choose(n-3, 2))*p^6-4233.6^2)
298.7945

Наступний код Mathematica також обчислює стандартне відхилення, яке дає той же результат.

mySTD[n_,p_]:=Sqrt[Binomial[n,3]p^3+12Binomial[n,4]p^5+30 Binomial[n,5]p^6+20Binomial[n,6]p^6-(Binomial[n,3]p^3)^2]
mySTD[50,0.6] // gives 298.795

2
Насправді досить просто. Молодці! Я трохи оновив вашу відповідь, спростивши вирази та додавши код Mathematica . Я також запускав своє моделювання 10 к разів і отримував ступінь 295,37, дуже близький до очікуваного значення.
LBogaardt

1
Дякуємо за редагування Я радий, що моделювання з 10 к ітераціями підтверджує відповідь!
Робін Райдер

Я знайшов оригінальну довідку для спрямованих графіків: Holland (1970). Метод виявлення структури в соціометричних даних.
LBogaardt

0

Я пропоную дещо інший підхід виведення .X2

З тією ж різницею випадків, що і Робін Райдер:

  • Якщо тобто 3 вершини однакові, тому ми повинні вибрати 3 вершини з n можливих . У нас повинно бути три ребра . Комбіновано:{i,j,k}={i,j,k}(n3)p3(n3)p3

  • Якщо і мають дві спільні вершини, це означає, що для яких і навпаки (кожен трикутник має одну вершину, яка не є частиною іншого трикутника). Wlog уявіть, що і - це згадані вершини, що роз'єднуються, і = , = . Для досягнення = , = , нам слід вибрати однакові дві вершини з n можливих . Для{i,j,k}{i,j,k}v{i,j,k}v{i,j,k}v=kv=kiijjiijj(n2)kkми повинні вибрати ще дві вершини, що залишилися. Перший: і другий: . Оскільки край і однаковий, у нас повинно бути 5 ребер . Комбіновано:(n2)(n3){i,j}{i,j}p5(n2)(n2)(n3)p5

  • Якщо і мають лише одну вершину спільного, то 4 - диз'юнкти. Уявіть, wlog, що = . Це означає, що з n можливих вершин ми повинні вибрати 1 . Для трикутника вибираємо 2 вершини з решти . Для трикутника виберемо 2 з решти , це пов'язано з припущенням, що і . Оскільки у нас є одна спільна вершина, ми повинні мати 6 ребер{i,j,k}{i,j,k}iin{i,j,k}(n1)(n12){i,j,k}(n3)(n32)j{i,j,k}k{i,j,k}p6 . Комбіновано:n(n12)(n32)p6

  • В останньому випадку: Якщо і не мають спільної вершини, то два трикутника є роз'єднаними. Вибираємо перший трикутник, 3 вершини з n можливих . І другий трикутник, 3 вершини з залишилися . Трикутники є роз'єднаними, тобто вони не мають ребер і вершин, тому 6 ребер повинні бути присутніми . Комбіновано:{i,j,k}{i,j,k}(n3)(n3)(n33)p6(n3)(n33)p6

Як і у підході Робіна Райдера, ми також можемо перевірити, що:

(n3)+(n2)(n2)(n3)+n(n12)(n32)+(n3)(n33)=(n3)2 виконується.

Це призводить до:

Var[X]=E[X2]E[X]2=(n3)p3+(n2)(n2)(n3)p5+n(n12)(n32)p6+(n3)(n33)p6(n3)2p6.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.