Я припускаю, що ви можете оцінити f і gаж до нормалізуючої константи. Позначимоf(x)=fu(x)/cf і g(x)=gu(x)/cg.
Послідовний оцінювач, який може бути використаний, є
DKLˆ(f||g)=[n−1∑jfu(xj)/πf(xj)]−11N∑iN[log(fu(zi)gu(zi))fu(zi)πr(zi)]−log(r^)
де
r^=1/n1/n∑jfu(xj)/πf(xj)∑jgu(yj)/πg(yj).(1)
є важливим оцінкою вибірки для співвідношення
cf/cg. Тут ви використовуєте
πf і
πg як інструментальна щільність для
fu і
gu відповідно, і
πr для орієнтації на коефіцієнт журналу ненормалізованої щільності.
Тож нехай {xi}∼πf, {yi}∼πg, і {zi}∼πr. Чисельник (1) сходить доcf. Знаменник сходить доcg. Коефіцієнт відповідає теоремі безперервного відображення. Журнал коефіцієнта узгоджується безперервним відображенням знову.
Що стосується іншої частини оцінювача,
1N∑iN[log(fu(zi)gu(zi))fu(zi)πr(zi)]→ascfE[log(fu(zi)gu(zi))]
за законом великої кількості.
Моя мотивація полягає в наступному:
DKL(f||g)=∫∞−∞f(x)log(f(x)g(x))dx=∫∞−∞f(x){log[fu(x)gu(x)]+log[cgcf]}dx=Ef[logfu(x)gu(x)]+log[cgcf]=c−1fEπr[logfu(x)gu(x)fu(x)πr(x)]+log[cgcf].
Тож я просто розбиваю його на придатні шматки.
Для отримання додаткових ідей щодо моделювання коефіцієнта ймовірності я знайшов документ, який містить декілька:
https://projecteuclid.org/download/pdf_1/euclid.aos/1031594732