Помилка в оцінці розміру набору?


9

Припустимо, у нас є множина A і підмножина B. Якщо ми знаємо | A |, то можемо обчислити | B | знайшовши ймовірність p, що елемент, вибраний рівномірно з A, належить до B. Зокрема | A | p = | B |.

Припустимо, ми генеруємо n елементів A рівномірно і використовуємо ці дані для оцінки p (кількість елементів у B, поділене на n) і, отже, оцінки | B |.

Наскільки достовірна ця оцінка? Тобто як ми можемо обчислити помилку?

Як побічне запитання, чи існує назва цієї методики? (здається, це математична версія техніки маркування та відновлення )


1
Це біноміальна оцінка. (
Узагалі

Відповіді:


8

Ви оцінюєте пропорції. Для конкретності, уявіть, що А - це кількість виборців, а В - сукупність виборців, які голосують за конкретного кандидата. Таким чином, p був би відсоток виборців, які проголосували б за цього кандидата. Дозволяє:

π - справжній відсоток людей, які проголосували б за кандидата

Іншими словами:

π=|B||A|

Тоді кожен з ваших зразків - це випробування в Бернуллі з вірогідністю або рівнозначно, ви можете уявити, що кожен з ваших зразків - це опитування потенційних виборців, запитуючи їх, чи буде вони голосувати за кандидата. Таким чином, MLE задається:ππ

p=nBn

де

nB - кількість людей, які сказали, що проголосують за кандидата, або кількість елементів, що належать до набору B у вашій вибірці розміру .n

Стандартна помилка для вашої оцінки:

π(1π)n

Вищенаведене можна наблизити, використовуючи MLE для тобто:π

p(1p)n

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.