Що це означає, коли всі краї в реальній мережі / графіку є статистично так само випадковими?


11

Я використовував метод вилучення магістральної мережі, описаний у цій статті: http://www.pnas.org/content/106/16/6483.abrief

В основному, автори пропонують метод, заснований на статистиці, що створює ймовірність для кожного краю графіка, що край міг трапитися випадково. Я використовую типове обмеження статистичної значущості 0,05.

Я застосовую цей метод у кількох реальних мережах, і що цікаво, в деяких мережах немає ребер настільки важливих. Я намагаюся зрозуміти, що це тягне за собою мережу. Єдиний раз, коли я застосував метод до мережі, і його краї не виявились такими значущими, коли я застосував метод до генерованих випадковими мережами, саме так ми і очікували.

Як приклад мережі реального світу, ви, можливо, бачили недавню візуалізацію мережі, яка тривала в The Economist, що демонструє поляризацію Сенату США за останні 25 років: http://www.economist.com/news/united-states/21591190 -з’єднані-стани-амеби . Я застосував метод вилучення магістральної мережі до цих мереж, і жоден край не став таким значним. Незважаючи на те, що сирі краї, очевидно, демонструють перевагу прихильності та групування, це випадково? Чи є мережа мереж для голосування Сенату по суті випадковою?

Відповіді:


6

Нульова гіпотеза за основними методами є

[Нормовані] ваги, що відповідають зв’язкам певного вузла градусного к, виробляються випадковим призначенням з рівномірного розподілу.

Якщо немає «значущих» ребер, то нульова гіпотеза дотримується для всього графіка, тобто вагові ребра є результатом схильності вузлів до надсилання та отримання зв’язків.

Залежно від взаємозв'язків, які ви аналізуєте, метод хребта може бути невідповідним. Цей метод найкраще працює для мереж, які є концептуально одномодовими зваженими мережами. Двомодові мережі можуть проектуватися як зважена одномодова мережа, але часто це не має сенсу.

Спираючись на ваш приклад в Economist, не має сенсу аналізувати голосування в Сенаті як одномодову мережу, зважену на кількість голосів, що ділилися. Голосування в Сенаті - це підписані, двомодні відносини. Сенатори (i) мають стосунки до законодавчих актів (j), і вони або утримуються від голосування (0), або проголосують за (+1) або проти (-1) законодавства. Перетворити мережу в зважену одномодову мережу узгодження, а потім виконати аналіз магістралі на ній було б серйозним скороченням даних. Деякі законодавчі акти є більш політично розбіжними, а деякі мають більше голосів, ніж інші - основні методи не зафіксували б ці механізми.

Ви можете розглянути тести умовного уніфікованого графіка (CUG) замість магістральних методів. Ідея цих тестів полягає в тому, щоб визначити, чи певні властивості рівня графіків (наприклад, кластеризація, середня довжина шляху, централізація, гомофілія) є результатом випадковості. Процес такий:

  1. Візьміть вимірювання f із спостережуваного графіка
  2. Створити випадковий графік, який керує певними властивостями спостережуваного графіка (наприклад, розмір, кількість ребер, розподіл ступенів тощо)
  3. Візьміть вимірювання f з випадкового графіка
  4. Повторіть кроки 2 і 3 багато разів (наприклад, 1000), щоб отримати нульовий розподіл
  5. Порівняйте спостережуване вимірювання з нульовим розподілом

Для двомодових мереж було б доцільно створювати випадковий графік, переймаючи спостережуваний графік (і tnet, і statnet в R мають підпрограми для перетворення двомодових мереж). Якщо для вимірювання f потрібна одномодова мережа, процес рандомізації слід провести в двомодовій мережі, перш ніж проектувати її як одномодову мережу.


4

У статті, яку ви цитуєте, автори вважають, що у складній мережі "вузли представляють елементи [модельованої] системи, а зважені ребра ідентифікують наявність взаємодії та її відносну силу" (наголос мною) .

У мережі, яку ви вивчаєте, якщо я правильно розумію статтю Economist, існує посилання між двома сенаторами, якщо вони проголосували аналогічно принаймні 100 разів. Отже, посилання не моделюють взаємодії, а подібність (між поведінкою сенаторів, що голосують). З мого досвіду, мережі подібності не демонструють такого ж ступеня розподілу, як мережі взаємодії, в сенсі це не настільки неоднорідно. Також пороговий параметр, який використовується при витягуванні мережі (тут: 100), іноді сильно впливає на розподіл ступеня.

Більше того, я не міг знайти згадки про будь-яку вагу в статті Economist. Однак наявність ваг здається важливим моментом у способі, описаному у праці Ángeles Serrano та ін . ви цитуєте у своєму запитанні.

З цих двох спостережень видається можливим, що метод не працює точно на цих даних, оскільки він не був розроблений для обробки мереж такого типу. Можливо, ви можете перевірити розподіл ступенів: це зосереджене на характерному значенні, або неоднорідне? А як щодо ваг, чи є такі?


Я сам відтворив дані з вихідного веб-сайту, тому я включив ваги і не застосував довільний поріг відсічення. Тому я думаю, що дані, до яких я застосував метод опорних кісток, не повинні були торкатися цих питань. Гарна ідея щодо перевірки розподілу ступеня - мені доведеться поглянути!
Ренді Олсон
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.