Поки відповіді були зосереджені на самих даних , що має сенс щодо сайту, на якому він є, та недоліків у ньому.
Але я є комп'ютерним / математичним епідеміологом за схильністю, тому я також збираюся трохи поговорити про саму модель, тому що це також стосується дискусії.
На мій погляд, найбільша проблема з папером - це не дані Google. Математичні моделі в епідеміології весь час обробляють безладні дані, і на мій погляд, проблеми з цим можна було б вирішити досить простою чутливістю.
Найбільша проблема, на мене, полягає в тому, що дослідники "прирекли себе на успіх" - чогось завжди слід уникати в дослідженнях. Вони роблять це в тій моделі, яку вони вирішили відповідати даним: стандартна модель SIR.
Якщо коротко, модель SIR (яка розшифровується як сприйнятливі (S) інфекційні (I)) відновлені (R)) - це ряд диференціальних рівнянь, які відстежують стан здоров'я населення під час перенесеного інфекційного захворювання. Заражені особи взаємодіють із сприйнятливими особинами та заражають їх, а потім вчасно переходять до категорії відновлених.
Це створює криву, яка виглядає приблизно так:
Красиво, чи не так? І так, ця є для епідемії зомбі. Довга історія.
У цьому випадку червона лінія - це те, що моделюється як "користувачі Facebook". Проблема полягає в наступному:
У базовій моделі SIR клас I з часом і неминуче асимптотично наближатиметься до нуля .
Це має статися. Не має значення, чи ви моделюєте зомбі, кір, Facebook чи обмін стеками тощо. Якщо ви моделюєте його за допомогою моделі SIR, неминучим висновком є те, що кількість населення в інфекційному (I) класі падає приблизно до нуля.
Існують надзвичайно прості розширення моделі SIR, які роблять це неправдою - або ви можете мати людей у відновленому (R) класі повернутися до сприйнятливих (S) (по суті, це були б люди, які залишили Facebook, змінившись на "Я ніколи не повертаюсь назад "до" я можу повернутися колись "), або у вас можуть з’явитися нові люди (це були б маленькі Тіммі та Клер, які отримали свої перші комп'ютери).
На жаль, автори не підходили до цих моделей. Це, до речі, поширена проблема математичного моделювання. Статистична модель - це спроба описати закономірності змінних та їх взаємодії всередині даних. Математична модель - твердження про реальність . Ви можете отримати модель SIR для розміщення багатьох речей, але ваш вибір моделі SIR також є твердженням про систему. А саме те, що як тільки він досягне піку, він спрямовується до нуля.
Між іншим, інтернет-компанії користуються моделями утримання користувачів, які схожі на епідемічні моделі, але вони також значно складніші, ніж представлені в статті.