Ага, відмінне запитання !!
Я б також наївно запропонував логістичну криву S-подібної форми, але це, очевидно, погано підходить. Наскільки мені відомо, постійне збільшення є приблизним, оскільки YouTube рахує унікальні перегляди (один на IP-адресу), тому не може бути більше переглядів, ніж комп'ютери.
Ми могли б використовувати епідеміологічну модель, коли люди мають різну сприйнятливість. Щоб зробити це просто, ми могли б поділити його на групу підвищеного ризику (скажімо, діти) та групу з низьким рівнем ризику (скажімо, дорослі). Назвемо питому вагу "заражених" дітей та питому вагу "заражених" дорослих за час . Я назву (невідома) кількість осіб із групи високого ризику, а - (також невідомо) число осіб із групи низького ризику.x(t)y(t)tXY
x˙(t)=r1(x(t)+y(t))(X−x(t))
y˙(t)=r2(x(t)+y(t))(Y−y(t)),
де . Я не знаю, як вирішити цю систему (можливо, @EpiGrad хотів би), але, дивлячись на ваші графіки, ми могли б зробити кілька спрощення припущень. Оскільки зростання не насичується, можна вважати, що дуже великий, а малий, абоr1>r2Yy
x˙(t)=r1x(t)(X−x(t))
y˙(t)=r2x(t),
що прогнозує лінійний ріст, коли група високого ризику повністю заражена. Зауважимо, що для цієї моделі немає причин вважати , навпаки, тому що великий термін тепер підписаний у .r1>r2Y−y(t)r2
Ця система вирішує проблему
x(t)=XC1eXr1t1+C1eXr1t
y(t)=r2∫x(t)dt+C2=r2r1log(1+C1eXr1t)+C2,
де і - константи інтеграції. Тоді загальна "заражена" популяція становить
, яка має 3 параметри та 2 константи інтеграції (початкові умови). Я не знаю, як легко було б помістити ...C1C2x(t)+y(t)
Оновлення: граючи з параметрами, я не міг відтворити форму верхньої кривої з цією моделлю, перехід від до завжди різкіший, ніж вище. Продовжуючи ту ж ідею, ми знову можемо припустити, що є два види користувачів Інтернету: "акціонери" та "loners" . Акціонери заражають один одного, а самотні випадково натикаються на відео. Модель є0600,000,000x(t)y(t)
x˙(t)=r1x(t)(X−x(t))
y˙(t)=r2,
і вирішує
x(t)=XC1eXr1t1+C1eXr1t
y(t)=r2t+C2.
Можна припустити, що , тобто, що при є лише пацієнт 0 , що дає оскільки є велика кількість. тож можна припустити, що . Тепер лише 3 параметри , і визначають динаміку.x(0)=1t=0C1=1X−1≈1XXC2=y(0)C2=0Xr1r2
Навіть у цій моделі здається, що перегин дуже різкий, він не дуже добре підходить, тому модель повинна бути неправильною. Це робить проблему дуже цікавою насправді. Як приклад, наведена нижче цифра побудована з , і .X=600,000,000r1=3.667⋅10−10r2=1,000,000
Оновлення: Із коментарів я зібрав, що Youtube рахує перегляди (по-своєму таємно), а не унікальні IP-адреси, що робить велику різницю. Назад до дошки для малювання.
Щоб зробити це просто, припустимо, що глядачі "заражені" відео. Вони повертаються, щоб регулярно спостерігати за ним, поки не очистять інфекцію. Однією з найпростіших моделей є SIR (стійкий до зараження), який є наступним:
˙ I (t)=αS(t)I(t)-βI(t) ˙ R (t)=βI(t)
S˙(t)=−αS(t)I(t)
I˙(t)=αS(t)I(t)−βI(t)
R˙(t)=βI(t)
де - швидкість зараження, а - швидкість кліренсу. Загальна кількість переглядів така, що , де - середнє число переглядів на день на заражену особу.β x ( t ) ˙ x ( t ) = k I ( t ) kαβx(t)x˙(t)=kI(t)k
У цій моделі кількість переглядів починає різко збільшуватися через деякий час після початку інфекції, що не стосується оригінальних даних, можливо, тому, що відео також розповсюджується невірусним (або мемом) способом. Я не є експертом в оцінці параметрів моделі SIR. Просто граючи з різними значеннями, ось що я придумав (в R).
S0 = 1e7; a = 5e-8; b = 0.01 ; k = 1.2
views = 0; S = S0; I = 1;
# Exrapolate 1 year after the onset.
for (i in 1:365) {
dS = -a*I*S;
dI = a*I*S - b*I;
S = S+dS;
I = I+dI;
views[i+1] = views[i] + k*I
}
par(mfrow=c(2,1))
plot(views[1:95], type='l', lwd=2, ylim=c(0,6e8))
plot(views, type='n', lwd=2)
lines(views[1:95], type='l', lwd=2)
lines(96:365, views[96:365], type='l', lty=2)
Модель, очевидно, не ідеальна, і її можна доповнити багатьма звуковими способами. Цей дуже грубий ескіз передбачає мільярд переглядів десь у березні 2013 року, давайте подивимось ...