Інтерпретація різниці між лонормальним та розподілом закону про потужність (розподіл мережевих ступенів)


22

По-перше, я не статистик. Однак я робив статистичний аналіз мережі для свого доктора наук.

У рамках мережевого аналізу я побудував додаткову функцію кумулятивного розподілу (CCDF) мережевих ступенів. Я виявив, що на відміну від звичайних мережевих дистрибутивів (наприклад, WWW), розподіл найкраще відповідає лонормальному розподілу. Я намагався пристосувати його до закону про владу, використовуючи сценарії Матлаба Клаузета та ін., Я виявив, що хвіст кривої має закон про владу із відсіченням.

введіть тут опис зображення

Пунктирною лінією представлений закон про владу. Фіолетова лінія являє собою нормальне розміщення журналу. Зелена лінія являє собою експоненціальну форму.

Що я намагаюся зрозуміти, що це все означає? Я прочитав цей документ Ньюмена, який трохи торкається цієї теми: http://arxiv.org/abs/cond-mat/0412004

Нижче моя дика здогадка:

Якщо розподіл ступенів слід за розподілом закону про владу, я розумію, що це означає, що існує лінійна преференційна прихильність у розподілі посилань та мережевий ступінь (багатий отримує більш багатий ефект або процес Юлеса).

Чи правильно я кажу, що з лонормальним розподілом, якому я є свідком, на початку кривої є підлінійне переважне приєднання і стає більш лінійним у напрямку до хвоста, де воно може бути встановлене законом про владу?

Крім того, оскільки нормальний розподіл журналу відбувається, коли логарифм випадкової величини (скажімо, X) нормально розподілений, це означає, що в нормальному розподілі log є більш малі значення X і менш великі значення X, ніж a Випадкова величина, яка слідує за розподілом закону про владу, мала б?

Що ще важливіше, що стосується розподілу мережевих ступенів, чи бажане переважне вкладення у звичайний журнал все ще пропонує мережу без масштабу? Мій інстинкт підказує мені, що оскільки хвіст кривої може бути встановлений законом про потужність, мережу все одно можна зробити висновком, що демонструє безмасштабні характеристики.


2
Майку, я думаю, було б дуже цікаво подивитися сюжет, який ти дивишся. Ви б не хотіли відредагувати свою відповідь, щоб включити її? Одне, що я одразу помітив, це те, що наслідки щодо законів про владу та пільгового прихильності зворотні. Хоча (деякі) пільгові схеми прихильності генерують розподіл ступенів енергетичного права, зворотне значення не відповідає дійсності (тобто це не єдиний спосіб). Деяка інформація про те, яку мережу ви дивитесь, також може бути корисною. Ура.
кардинал

1
Я маю на увазі переважне вкладення - це просто інша назва ефекту "багатий стає багатшим", правда? Якщо це так, то лінійний розподіл ступенів (закон про владу) є лише одним із багатьох розподілів ступенів, який може продемонструвати переважне приєднання? Іншими словами, якщо градієнт кривої негативний на графіку лог-журналу, то існують деякі елементи переважного кріплення незалежно від розподілу? Тоді відмінність між розподілом нормальних норм і розподілом ступеня енергії не стільки в тому, чи є переважна прив’язаність, скільки пропорційність.
Майк

1
Зауважте, що пільгове вкладення - це (стохастичний) процес, який генерує розподіл ступенів енергетичного права для мережі. Нахил лінії буде змінюватися відповідно до показника масштабування для закону потужності, але у випадку лонормального, сюжет не буде лінійним навіть у хвості. Градієнт розподілу виживання завжди буде негативним, незалежно від ефекту. (Чому?)
кардинал

Це дуже гарна редакція. Спасибі, Майкл! Лонормальне розташування в регіоні, який ви показали, є досить чудовим. Схоже, це може трохи зламатися в хвіст.
кардинал

Дякую за Вашу відповідь ще кардинально. Отже, ви погоджуєтесь, що пільгове вкладення все ще працює в мережі, яку я спостерігаю? Ще одне питання, яке виникає, полягає в тому, чи мережа без масштабу. Якщо в мережі працюють пільгові вкладення і поки мережа приймає нових членів, то мережу можна класифікувати як безмасштабну, навіть якщо розподіл ступеня мережі не є лінійним. Тут я не дуже впевнений.
Майк

Відповіді:


12

Я думаю, було б корисно розділити це питання на дві частини:

  1. Яка функціональна форма вашого емпіричного розподілу? і
  2. Що ця функціональна форма означає про процес генерації у вашій мережі?

Перше питання - це питання статистики. Якщо ви застосували методи Клаузета та ін. для встановлення розподілу закону про владу, і ці методи дали вам для верхнього хвоста, тоді ви можете сказати, що верхній хвіст (дивлячись на вашу фігуру, це або так багато) правдоподібно влада-закон розподілений. Якщо методи дали вам ви цього не можете сказати, навіть якщо прилягання добре виглядає для очей. Вирішити, чи краще розміщення колоди - це в основному те саме. Чи можете ви відхилити цю модель як процес генерування даних про розподіл ступеня? Якщо ні, то вам дозволяється ставити журнал нормальних до категорії "правдоподібних".p>0,1х15p<0,1

Як невеликий технічний момент, градуси є цілими величинами, тоді як нормальний розподіл для журналу вимагає безперервної змінної, тому ці два фактично не сумісні (якщо ви не говорите лише про коли різниця між цілими числами та реальними значеннями для цих видів питань стає незначним). Щоб зробити статистику належним чином, ви хочете записати pdf для "нормально" розподіленої цілої кількості, вивести для нього оцінки та застосувати їх до своїх даних.х1

Друге питання насправді складніше двох. Як дехто зазначав у коментарях вище, існує багато механізмів, які виробляють розподіл влади та закону, а переважне приєднання (у всіх його варіаціях та славі) є лише одним із багатьох. Таким чином, спостереження за розподілом ваших даних щодо закону про владу (навіть справжній, який проходить необхідні статистичні випробування) не є достатнім доказом для висновку, що процес генерації був привілейованим. Або, загалом, якщо у вас є механізм A, який виробляє деякий зразок X у даних (наприклад, нормальний ступінь розподілу журналу у вашій мережі). Спостереження за шаблоном X у ваших даних не є свідченням того, що ваші дані були створені механізмом А. Дані узгоджуються з A, але це не означає, що A є правильним механізмом.

Щоб дійсно показати, що A - це відповідь, вам слід перевірити її механістичні припущення безпосередньо і показати, що вони також є вашими для вашої системи, а також бажано також показати, що інші дані механізму також містять дані. По-справжньому чудовий приклад частини тестування припущень був зроблений Сидом Реднером (див. Малюнок 4 цієї статті ), в якому він показав, що для мереж цитування фактичне припущення щодо лінійного переважного вкладення є в даних.

Нарешті, термін "безмасштабна мережа" перевантажений в літературі, тому я настійно пропоную уникати цього. Люди використовують його для позначення мереж з розподілами статечних ступенів ідо мереж, вирощених за допомогою (лінійного) пільгового вкладення. Але як ми тільки що пояснили, ці дві речі не є однаковими, тому використання одного терміна для позначення обох просто заплутане. У вашому випадку нормальний розподіл журналу повністю не відповідає класичному механізму лінійного переважного вкладення, тож якщо ви вирішите, що log-норма - це відповідь на питання 1 (у моїй відповіді), то це означатиме, що ваша мережа не є ' масштаб вільний 'у цьому сенсі. Те, що верхній хвіст є «нормальним» як розподіл закону про владу, було б безглуздим у цьому випадку, оскільки завжди є деяка частина верхнього хвоста будь-якого емпіричного розподілу, яка пройде тест (і він пройде через тест втрачає силу, коли не так вже й багато даних, і саме це відбувається в крайньому верхньому хвості).


Ви змішували <і>, коли говорили про значення р для верхнього хвоста?
Девід Натан

У цьому коментарі умови p-значення є правильними. Значення р, згадані тут, походять з розділу 4.1 arxiv.org/abs/0706.1062 , де великі значення є хорошими пристосуваннями, а маленькі - поганими. Див., Зокрема, виноску 8 внизу сторінки 17.
Джонатан С.

3

Таке класне питання. У мене про це пов’язана розмова, пов’язана з питанням, яке я задав в іншому місці на CrossValidated. Там я запитав, чи гамма-розподіл є хорошим розподілом, який слід використовувати для моделювання соціальної мережі, де ймовірність зв’язків є ендогенною певній постійній "популярності", характерній для вузлів. @NickCox запропонував замість цього використовувати лонормальний розподіл. Я відповів, що лонормальний розподіл має деяке теоретичне обгрунтування як основний процес, що описує популярність, оскільки популярність може бути інтерпретована як продукт багатьох випадкових змінних з позитивною оцінкою (наприклад, багатство, дохід, зріст, сексуальна доблесть, бойова доблесть, IQ). Це має для мене більше сенсу, ніж теоретичне обгрунтування закону про владу, і воно узгоджується з емпіричними даними, що дозволяє припустити, що форма закону про владу є надто негнучкою, щоб пояснити зміну міжмережевих розподілів ступенів. Лонормальне, для порівняння, має дуже гнучку форму, режим наближається до нуля для великої дисперсії. Крім того, має сенс, щоб похилість розподілу ступенів збільшувалася зі зміною за рахунок переважного ефекту прикріплення.

Підсумовуючи, я вважаю, що лонормальний розподіл найкраще відповідає вашим даним, оскільки лонормальний розподіл описує базовий процес формування ступеня розподілу краще, ніж закон про потужність або експоненціальний розподіл.


2

Заходьте на цей сайт після підрахунку моїх міхурових розподілів та використання закону потужності для даних про в'язкість.

Снімінг за прикладними наборами даних у статті закону про владу Клаузета та ін. вони вивели деякі справжні жахи наборів даних, далекі від наборів даних закону про владу, щоб підтримати їх аргумент. Просто від здорового глузду я, звичайно, не намагався б прилаштувати функцію закону про владу до всього діапазону даних для більшості з них. Однак поведінка самомасштабування в реальному світі може бути дійсною для частини спостережуваної системи, але руйнуватися, коли деяка властивість системи досягає фізичної чи функціональної межі.

Наведені нижче читані документи посилаються на відповідність кривих зростання екологів, з хорошою дискусією щодо закону про владу та відповідних розподілів на основі моделей поведінки населення на основі спостережень.

Автор набагато більш прагматичний, ніж Клаузет та ін. Цитуючи: "... якщо мета лише найкращого рівня і масштаби поза вікном масштабу набору даних не обговорюються, будь-яка модель може бути достатньою, враховуючи, що вона дає хороший результат і не створює максимумів або мінімумів у досліджуваному вікні шкали. . " "Один часто змушений не використовувати ту саму модель, як інші дослідники застосовували до своїх даних, щоб можна було порівнювати значення параметрів, але це можна зробити на додаток до застосування кращої моделі чи моделі з кращими очікуваними показниками форми, або те й інше ». Спокійні слова.

Тьорве, Е. (2003). Форми та функції кривих видової площі: огляд можливих моделей. Журнал біогеографії, 30 (6), 827-835.

Тьорве, Е. (2009). Форми та функції кривих видової площі (ii): огляд нових моделей та параметризації. Журнал біогеографії, 36 (8), 1435-1445.


1

Наведені вище результати показують, що розподіл ступенів може бути як законом потужності, так і лонормальним, що може припустити, що в досліджуваній мережі співіснують невеликі властивості світу та вільних масштабів. Щоб перевірити, чи мережа без масштабу (з постійним параметром масштабування) з переважним вкладенням, часто необхідний експериментальний дизайн. У згаданій статті статті Сіда Реднера для розуміння механізму росту використовується швидкість росту. У той час як Gallos, Song та Makse використовують поля для покриття мережі та роблять висновок, що розподіл ступеня мережі слід розподілу закону про потужність, якщо NB (lB) ~ lB ^ -dB. Або вивчення взаємозв'язку між коефіцієнтом кластера та ступенем (чи відповідає взаємозв'язок закону потужності). В іншому випадку обговорюється, що ієрахічні мережі мають як властивості малої світової, так і масштабної. (введення фрактальної шкали безкоштовно,

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.