Це часткова відповідь, яка передбачає, що ми знаємо як розподіл з якого було відібрано вибірку, так і справжній (або бажаний) розподіл . Крім того, я припускаю, що ці розподіли різні. Якщо зразки були дійсно отримані через , але вони виглядають неправильно: зразки все ще є неупередженими і будь-яка адаптація (наприклад, видалення залишків), ймовірно, додасть упередженості.qpp
Я припускаю, що ви хочете знайти якусь статистику . Наприклад, може бути середнім значенням розподілу, в цьому випадку - функція ідентичності. Якби у вас були зразки отримані через , ви можете просто використовувати
Однак припустимо, у вас є лише зразки, які були отримані (з одного домену) з розподілом вибірки . Тоді ми все ще можемо отримати неупереджену оцінку шляхом зважування кожного зразків відповідно до відносної ймовірності виникнення при кожному розподілі:
sp=E{f(X)|X∼p}s(p)f{x1,…,xn}p
sp≈1n∑i=1nf(xi).
xi∼qspsp≈1n∑i=1np(xi)q(xi)f(xi).
Причина цього працює в тому, що
як бажано. Це називається
вибіркою важливості .
E{p(X)q(X)f(X)∣∣∣X∼q}=∫p(X)f(X)dx,