Я натрапив на цей документ, який використовує виявлення аномалії посилань для прогнозування актуальних тем, і мені здалося, що це неймовірно інтригує. Документ - "Виявлення нових тем у соціальних потоках за допомогою виявлення аномалії посилань" .
Я б хотів тиражувати це на інший набір даних, але я недостатньо знайомий з методами, щоб знати, як їх використовувати. Скажімо, у мене є серія знімків мережі вузлів протягом шести місяців. Вузли мають розподілений ступінь з довгими хвостами, більшість з яких мають лише кілька з'єднань, а деякі мають дуже багато. Нові вузли з’являються протягом цього періоду часу.
Як я міг реалізувати послідовно знижені нормовані розрахунки максимальної ймовірності, використовувані в роботі, щоб виявити аномальні зв’язки, які, на мою думку, можуть бути попередниками сплеску? Чи є інші методи, які були б більш доречними?
Я запитую як теоретично, так і практично. Якщо хтось міг би вказати мені на спосіб реалізації цього в python або R, це було б дуже корисно.
Хтось? Я знаю, у вас, розумні люди, є кілька початкових думок для відповіді,