Існує математична теорема під назвою "закон великих чисел". Уявіть, що ви хочете визначити ймовірність того, що монета придумає голову. "Популяція" монетних оборотів - це нескінченність - набагато більша, ніж 300 000 000+ людей у Сполучених Штатах. Але згідно із Законом про великі числа, чим більше ви будете гортати монети, тим точнішою буде ваша оцінка.
Ідеальне опитування: У ідеальному опитуванні опитувальники випадковим чином вибиратимуть імена з перепису в США, вони дізнаються, де живуть ці люди, а потім пітимуть і постукують у двері. Якщо людина каже, що планує голосувати, опитувальник запитує, за кого вони голосують, і записує їх відповідь. Опитування подібним чином математично гарантовано працює, і кількість помилок у вашому вимірі для будь-якого заданого рівня довіри можна легко обчислити .
Ось що означає помилка: припустимо, що на основі опитування ви зрозуміли, що існує 52-відсотковий шанс, що кандидат Кандидат Макперфект збирається перемогти, з помилкою 3% із 98% впевненістю. Це означає, що ви можете бути на 98% впевнені, що справжня частка виборців, які підтримують кандидата Awesome McPerfect, становить від 49% до 55%.
Примітка про помилку та впевненість Для даного розміру вибірки, чим впевненіше ви, тим більшою буде ваша помилка. Подумайте над цим - ви на 100% впевнені, що справжня частка, яка підтримує кандидата Awesome, становить від 0% до 100% (можлива найбільш помилка), і ви 0% впевнені, що справжня частка, яка підтримує кандидати Awesome, становить саме 52.0932840985028390984308% (нульова помилка). Більше впевненість означає більше помилок, менша впевненість означає менше помилок. Однак зв’язок між довірою та помилкою НЕ лінійний! (Дивіться: https://en.wikipedia.org/wiki/Confidence_interval )
Опитування в реальному світі: Оскільки опитувальників вертольотів дорого в усіх куточках країни дорого, щоб стукати у двері випадкових людей (хоча мені б хотілося, щоб це сталося; якщо ви мільярдер, і ви це бачите, будь ласка розглянемо фінансування цього), опитування в реальному світі є складнішими. Давайте розглянемо одну з найпоширеніших стратегій - викликати випадкових виборців і запитувати їх, за кого вони будуть голосувати. Це гарна стратегія, але вона має деякі невідомі недоліки:
- Люди часто вирішують не відповідати на телефон і відповідати на опитування (наприклад, я)
- Деякі демографічні показники мають більше шансів надати стаціонарний стан (наприклад, старші виборці)
- Деякі демографічні показники частіше реагують на опитування (наприклад, старші виборці)
Оскільки різні демографії голосують по-різному, опитувальники повинні зробити все можливе, щоб контролювати розбіжність у їхніх вихідних даних (виходячи з того, хто вирішив відповісти на телефон) та результати фактичних виборів. Наприклад, якщо 10% людей, які взяли телефон, були латиноамериканськими, але 30% виборців на останніх виборах були латиноамериканцями, то вони збираються в три рази більше надати латиноамериканським виборцям. Якщо 50% людей, які відповіли на телефон, були старшими за 60, але лише 30% людей, які проголосували на останніх виборах, були старшими за 60, вони збираються надати меншу вагу старшим виборцям, які відповіли. Це не ідеально, але це може призвести до вражаючих подвигів прогнозування (Нейт Сілвер правильно передбачив результати у кожному з 50 штатів на виборах 2012 року, використовуючи статистику,
Слова обережності для мудрих: Опитники роблять найкращі прогнози, які можуть зробити, ґрунтуючись на тому, як все працювало в минулому. Взагалі кажучи , все відбувається приблизно так само, як і раніше, або, принаймні, зміни є досить повільними, що недавнє минуле (на яке вони зосереджуються найбільше) буде нагадувати сучасне. Однак періодично відбуваються швидкі зрушення в електораті, і справи йдуть не так. Можливо, виборці Трампа дещо рідше, ніж ваш середній голосуючий, відповідатимуть на телефон, і зважування за демографічними показниками не сприймає цього. А може молодих людей (які переважно підтримують Хілларі) ще більшенавряд чи відповість на телефон, ніж прогнозують моделі, і ті, які відповідають на телефон, швидше за все будуть республіканськими. Або, можливо, навпаки обох - ми не знаємо. подібні речі - це приховані змінні, які не відображаються у загально зібраній демографії.
Ми б знали, якби ми надіслали опитувачів, щоб постукати у випадкові двері (ах, уявний мільярдер, читаючи це), оскільки тоді нам не довелося б зважувати речі на основі демографії, але до цього пальці схрещували.