На це питання вже є відмінні відповіді, але я хочу відповісти, чому стандартна помилка - це те, що вона є, чому ми використовуємо як найгірший випадок і як стандартна помилка змінюється на .p=0.5n
Припустимо, ми беремо опитування лише одного виборця, давайте назвемо його або її виборця 1 і запитаємо "чи будете ви голосувати за фіолетову партію?" Відповідь ми можемо кодувати як 1 для "так" і 0 для "ні". Скажімо, що ймовірність «так» дорівнює . Тепер ми маємо бінарну випадкову змінну яка дорівнює 1, а ймовірність і 0 з ймовірністю . Ми говоримо, що - змінна Бернуї з вірогідністю успіху , яку ми можемо записати . Очікуваний, або середній,pX1p1−pX1pX1∼Bernouilli(p)X1E(X1)=∑xP(X1=x)xX1. Але є лише два результати: 0 з ймовірністю і 1 з ймовірністю , тому сума просто . Зупиніться і подумайте. Це насправді виглядає цілком розумно - якщо є 30% шансів виборця 1 підтримати фіолетову партію, і ми зашифрували змінну до 1, якщо вони кажуть "так" і 0, якщо вони скажуть "ні", то ми б очікуємо, що середній показник складе 0,3 в середньому.1−ppE(X1)=0(1−p)+1(p)=pX1
Давайте подумаємо, що трапиться, квадратний . Якщо то а якщо то . Тож насправді в будь-якому випадку. Оскільки вони однакові, то вони повинні мати однакове очікуване значення, тому . Це дає мені простий спосіб обчислення дисперсії змінної Бернуї: Я використовую і тому стандартне відхилення - .X1X1=0X21=0X1=1X21=1X21=X1E(X21)=pVar(X1)=E(X21)−E(X1)2=p−p2=p(1−p)σX1=p(1−p)−−−−−−−√
Очевидно, я хочу поговорити з іншими виборцями - давайте назвати їх виборцем 2, виборцем 3, до виборця . Припустимо, що всі вони мають однакову ймовірність підтримки фіолетової партії. Тепер у нас є змінних Bernouilli, , до , з кожним для від 1 до . Усі вони мають однакове середнє значення, та дисперсію, .npnX1X2XnXi∼Bernoulli(p)inpp(1−p)
Я хотів би знайти, скільки людей у моїй вибірці сказали "так", і для цього я можу просто скласти всі . Я напишу . Я можу обчислити середнє або очікуване значення за допомогою правила, що якщо ці очікування існують, і розширюється що до . Але я додаю цих очікувань, і кожен з них , тому я отримую в цілому щоXiX=∑ni=1XiXE(X+Y)=E(X)+E(Y)E(X1+X2+…+Xn)=E(X1)+E(X2)+…+E(Xn)npE(X)=np. Зупиніться і подумайте. Якщо я опитую 200 людей, і кожен з них має 30% шансів сказати, що підтримує фіолетову партію, я, звичайно, очікую, що 0,3 х 200 = 60 людей скажуть «так». Тож формула виглядає правильно. Менш "очевидним" є те, як поводитися з дисперсією.np
Там є правило , яке говорить
,
але я можу використовувати його тільки якщо мої випадкові величини незалежні один від одного . Так добре, давайте зробимо це припущення, і за аналогічною логікою до того, як я можу побачити, що . Якщо змінна - сума незалежних випробувань Бернуллі з однаковою ймовірністю успіху , то ми говоримо, що має біноміальне розподіл, . Ми щойно показали, що середнє значення такого розподілу біномів - а дисперсія - .
Var(X1+X2+…+Xn)=Var(X1)+Var(X2)+…+Var(Xn)
Var(X)=np(1−p)Xp X X ∼ B i n o m i a l ( n , p ) n p n p ( 1 - p )n pXX∼Binomial(n,p)npnp(1−p)
Наша первісна проблема полягала в тому, як оцінити із вибірки. Розумний спосіб визначити наш оцінювач - . Наприклад, 64 з нашої вибірки з 200 людей сказали "так", ми вважаємо, що 64/200 = 0,32 = 32% людей кажуть, що підтримують фіолетову партію. Ви можете бачити , що є «зменшеною» версією нашого загального числа так-виборців, . Це означає, що вона все ще є випадковою змінною, але більше не слідує за біноміальним розподілом. Ми можемо знайти його середнє значення та дисперсію, оскільки коли ми масштабуємо випадкову величину постійним коефіцієнтом то вона підкоряється таким правилам: (значить, середня шкала тим самим коефіцієнтом ) іpp^=X/np^XkE(kX)=kE(X)kVar(kX)=k2Var(X) . Зауважте, як масштаб дисперсії на . Це має сенс, коли ви знаєте, що загалом дисперсія вимірюється в квадраті будь-яких одиниць, за якими вимірюється змінна: тут не так застосовна, але якби наша випадкова величина мала висоту в см, то дисперсія була б у які масштабуються по-різному - якщо ви подвоюєте довжину, ви вчетверо збільшуєте площу.k2cm2
Тут наш коефіцієнт масштабу . Це дає нам . Це чудово! В середньому наш оцінювач - це саме те, що "повинно бути", істинна (або чисельність населення) ймовірність того, що випадковий виборець говорить, що вони будуть голосувати за фіолетову партію. Ми говоримо, що наш оцінювач є неупередженим . Але хоча вона в середньому правильна, іноді вона буде занадто маленькою, а іноді занадто високою. Ми можемо бачити, наскільки це неправильно, дивлячись на його відмінність. . Стандартне відхилення - квадратний корінь,1nE(p^)=1nE(X)=npn=pp^Var(p^)=1n2Var(X)=np(1−p)n2=p(1−p)np(1−p)n−−−−−√і тому, що це дає нам зрозуміти, наскільки погано буде відзначений наш оцінювач (це фактично середньоквадратична помилка , спосіб обчислення середньої помилки, яка розглядає позитивні та негативні помилки як однаково погані, шляхом відсікання їх перед усередненням) , зазвичай його називають стандартною помилкою . Хорошим правилом, яке добре працює для великих зразків і з яким можна більш жорстко впоратися з відомою теоремою про центральний ліміт , є те, що більшу частину часу (приблизно 95%) оцінка буде помилкова менш ніж двома стандартними помилками.
Оскільки вона з’являється в знаменнику дробу, більш високі значення - більших зразків - зменшують стандартну помилку. Це чудова новина, так як якщо я хочу невелику стандартну помилку, я просто роблю розмір вибірки досить великим. Погана новина полягає в тому, що знаходиться всередині квадратного кореня, тому якщо я вчетверо збільшить розмір вибірки, я лише вдвічі зменшить стандартну помилку. Дуже малі стандартні помилки включатимуть дуже великі, отже, дорогі зразки. Є ще одна проблема: якщо я хочу націлити певну стандартну помилку, скажімо, 1%, то мені потрібно знати, яке значення використовувати в моєму обчисленні. Я можу використовувати історичні значення, якщо у мене є дані про опитування, але я хотів би підготуватися до найгіршого можливого випадку. Яке значенняnnppє найбільш проблематичним? Графік є повчальним.
Найгірша (найвища) стандартна помилка виникне, коли . Щоб довести, що я міг би використати обчислення, але якась алгебра середньої школи зробить трюк, доки я знаю, як « завершити квадрат ». p=0.5
p(1−p)−−−−−−−√=p−p2−−−−−√=14−(p2−p+14)−−−−−−−−−−−−−−√=14−(p−12)2−−−−−−−−−−−√
Вираз у дужках має квадрат, тому завжди буде повертати нульову чи позитивну відповідь, яка потім відбирається від чверті. У гіршому випадку (велика стандартна помилка) забирається якомога менше. Я знаю, що найменше, що можна відняти, це нуль, і це станеться, коли , тож коли . Підсумком цього є те, що я отримую більші стандартні помилки, намагаючись оцінити підтримку, наприклад, політичних партій, що наближаються до 50% голосів голосів, і нижчі стандартні помилки для оцінки підтримки пропозицій, які значно більше або значно менш популярні, ніж вони. Насправді симетрія мого графіка та рівняння показують мені, що я отримаю однакову стандартну помилку для моїх оцінок підтримки Фіолетової партії, незалежно від того, чи мали вони 30% популярну підтримку чи 70%.p−12=0p=12
То скільки людей мені потрібно опитувати, щоб стандартна помилка була нижче 1%? Це означало б, що в переважній більшості випадків моя оцінка буде в межах 2% від правильної пропорції. Тепер я знаю, що найгірша стандартна помилка - що дає мені і так . Це пояснило б, чому ви бачите цифри голосування в тисячах.0.25n−−−√=0.5n√<0.01n−−√>50n>2500
Насправді низька стандартна помилка не є гарантією хорошої оцінки. Багато проблем опитування мають практичний, а не теоретичний характер. Наприклад, я припускав, що вибірки були випадковими виборцями, кожен з однаковою ймовірністю , але взяти "випадкову" вибірку в реальному житті загрожує труднощами. Ви можете спробувати телефонне чи інтернет-опитування - але не тільки не кожен отримав телефон або доступ до Інтернету, але і ті, хто не має дуже різних демографічних показників (і намірів голосування) для тих, хто це робить. Щоб уникнути упередженості своїх результатів, опитувальні фірми фактично роблять усілякі складні зважування своїх зразків, а не просте середнєp∑Xinщо я взяв. Також люди брешуть на опитування! Різні способи компенсації такої можливості опитувальникам є, очевидно, суперечливими. Ви можете побачити різноманітні підходи в тому, як опитувальні фірми мали справу з так званим фактором "Сором'язливих торі" у Великобританії. Один з методів виправлення передбачав перегляд того, як люди голосували в минулому, щоб оцінити, наскільки правдоподібним є їхній заявлений намір голосування, але виявляється, що навіть коли вони не брешуть, багато виборців просто не пам'ятають свою виборчу історію . Коли у вас це відбувається, то, відверто кажучи, дуже мало сенсу зменшити "стандартну помилку" до 0,00001%.
На закінчення, ось кілька графіків, які показують, як на необхідний розмір вибірки - згідно з моїм спрощеним аналізом - впливає бажана стандартна помилка, і наскільки погано значення «найгіршого випадку» порівняно з більш придатними пропорціями. Пам'ятайте, що крива була б ідентичною кривій для через симетрію попереднього графіка p=0.5p=0.7p=0.3p(1−p)−−−−−−−√