"Частістська" завантажувальна програма сприймає дані як розумне наближення до невідомого розподілу населення. Тому розподіл вибірки статистики (функція даних) можна наблизити шляхом багаторазового перекомпонування спостережень із заміною та обчисленням статистики для кожного вибірки.
Нехай позначають вихідні дані. (У наведеному прикладі n = 5. ) Нехай y b = ( y b 1 , … , y b n ) позначає зразок завантажувальної програми. Такий зразок, ймовірно, матиме деякі спостереження, повторені один чи кілька разів, а інші спостереження відсутні. Середнє значення зразка завантажувального пристрою задається m b = 1y=(y1,…,yn)n=5yb=(yb1,…,ybn)Саме розподілmbпо ряду реплікацій завантажувального пристрою використовується для наближення розподілу вибірки з невідомої сукупності.
mb=1n∑i=1nybi.
mb
Для того, щоб зрозуміти зв’язок між частою завантажувальною стрічкою та байєсівською завантажувальною стрічкою, доцільно подивитися, як обчислити з іншого погляду.mb
У кожному зразку завантажувальної програми , кожне спостереження y i відбувається десь від 0 до n разів. Нехай h b i позначає кількість разів, коли y i виникає у y b , і нехай h b = ( h b 1 , … , h b n ) . Таким чином, h b i ∈ { 0 , 1 , … , n - 1 , n }ybyinhbiyiybhb=(hb1,…,hbn)hbi∈{0,1,…,n−1,n}і . З огляду на h b , ми можемо побудувати сукупність негативних ваг, що дорівнюють одному: w b = h b / n , де w b i = h b i / n . За допомогою цього позначення ми можемо повторно виразити середнє значення зразка завантажувальної програми як
m b = n ∑ i = 1 w b i∑ni=1hbi=nhbwb=hb/nwbi=hbi/n
mb=∑i=1nwbiyi.
Спосіб вибору спостережень для вибірки завантажувального пристрою визначає спільне розподіл для . Зокрема, h b має багаточленове розподіл і, таким чином, ( nwbhbТому ми можемо обчислити m b , витягнувши w b з його розподілу і обчисливши крапковий добуток з y . З цієї нової точки зору виявляється, що спостереженняфіксуються,коли ваги змінюються.
(nwb)∼Multinomial(n,(1/n)ni=1).
mbwby
За байєсівським висновком, спостереження справді приймаються як фіксовані, тому ця нова перспектива видається спільною з байєсівським підходом. Дійсно, обчислення середньої величини за байесівською завантажувальною стрічкою відрізняється лише розподілом ваг. (Тим не менш, з концептуальної точки зору байєсівська завантажувальна стрічка сильно відрізняється від частістської версії.) Дані є фіксованими, а ваги w - невідомі параметри. Нас може зацікавити деякий функціонал даних, який залежить від невідомих параметрів:
μ = n ∑ i = 1 w iyw
μ=∑i=1nwiyi.
Ось ескіз ескізу моделі за байєсівською завантажувальною стрічкою: розподіл вибірки для спостережень є багаточленом, а попередній для ваг є обмежуючим розподілом Діріхле, який надає всю свою вагу вершинам симплексу. (Деякі автори називають цю модель як мультиноміальну модель вірогідності .)
w∼Dirichlet(1,…,1).
μwy
∑i=1nwig(yi,θ)=0–,
g(yi,θ)θ0–θywwемпірична ймовірність і з узагальненим методом моментів (GMM).)
∑i=1nwi(yi−μ)=0.
θ=(μ,v)g(yi,θ)=(yi−μ(yi−μ)2−v).