Формули доступні в різних місцях, включаючи Вікіпедію .
Головне - помітити, що це залежить від того, що означають ваги . Зокрема, ви отримаєте різні відповіді, якщо ваги - це частоти (тобто ви просто намагаєтесь уникати складання всієї суми), якщо ваги насправді є дисперсією кожного вимірювання або якщо вони є лише деякими зовнішніми значеннями накладати на ваші дані.
У вашому випадку це поверхово виглядає так, що ваги є частотами, але їх немає . Ви генеруєте свої дані з частот, але це непросте питання про наявність у вашому наборі даних 45 записів із 3 та 15 записів із 4. Натомість потрібно використовувати останній метод. (Насправді все це сміття - вам справді потрібно використовувати більш досконалу модель процесу, що генерує ці числа! У вас, мабуть, немає чогось, що б виплюнуло нормально розподілені числа, тому характеризували систему зі стандартним відхиленням це не правильно робити.)
У будь-якому випадку, формула для дисперсії (з якої ви обчислюєте стандартне відхилення нормальним способом) з вагами "надійності"
∑wi(xi−x∗)2∑wi−∑w2i∑wi
x∗=∑wixi/∑wi
У вас немає оцінки ваг, яку я припускаю, що ви хочете вважати пропорційною надійності. Якщо взяти відсотки так, як ви збираєтеся, зробити аналіз складно, навіть якщо вони породжені процесом Бернуллі, тому що якщо ви отримаєте оцінку 20 і 0, у вас є нескінченний відсоток. Зважування за зворотною стороною SEM - це звичайна, а часом і оптимальна річ. Можливо, вам слід скористатися байєсівською оцінкою або балом Вільсона .