Так, слід очікувати, що обидва приклади (невагомі проти зважених) дадуть однакові результати.
Я реалізував два алгоритми зі статті Вікіпедії.
Цей працює:
Якщо всі xi виведені з одного і того ж розподілу, а цілі ваги wi вказують на частоту зустрічань у вибірці, то неупереджений оцінювач зваженої дисперсії сукупності задається:
s2 =1V1−1∑Ni=1wi(xi−μ∗)2,
Однак ця (з дробовими вагами) для мене не працює:
xi1/wi
s2 =V1V21−V2∑Ni=1wi(xi−μ∗)2
Я досі досліджую причини, чому друге рівняння не працює за призначенням.
/ EDIT: Знайдено причину, по якій друге рівняння не працювало, як я думав: ви можете використовувати друге рівняння лише в тому випадку, якщо у вас є нормалізовані ваги або дисперсія ("надійність") ваг, і воно НЕ є неупередженим, тому що якщо ви цього не зробите використовуючи ваги "повторення" (підраховуючи кількість разів, коли спостереження спостерігалося, і, таким чином, його слід повторити в математичних операціях), ви втрачаєте можливість підрахувати загальну кількість спостережень, і, таким чином, ви не можете використовувати коефіцієнт корекції.
Таким чином, це пояснює різницю ваших результатів із застосуванням зваженої та не зваженої дисперсії: ваші обчислення упереджені.
Таким чином, якщо ви хочете мати неупереджену зважену дисперсію, використовуйте лише "повторити" ваги і використовуйте перше рівняння, яке я розмістив вище. Якщо це неможливо, ну, ви не можете допомогти.
Я також оновив статтю Вікіпедії, якщо ви хочете отримати додаткову інформацію:
http://en.wikipedia.org/wiki/Weighted_arithmetic_mean#Weighted_sample_variance
І пов'язана стаття про неупереджену зважену коваріацію (що насправді є такою ж дисперсією через ідентичність поляризації ):
Правильне рівняння для зваженої неупередженої коваріації вибірки