Це потрапляє в область вибіркового обстеження. В принципі, методи працюють, оскільки використовується рандомізація. Ось речі, які можуть відрізнятися в опитуваннях на основі суб'єктивних рішень.
Рамка для відбору проб. З якої групи виборців я повинен взяти свій зразок?
Як мені впоратися з мінливістю нерішучого виборця, який може змінити свою думку щодо Обами проти Ромні на основі вчорашнього опитування чи наступних тижнів?
Петро торкнувся упередженості. Опитування літературних дайджестів 1936 року було катастрофою. Він обрав республіканського кандидата у FDR, оскільки кадр вибірки базувався на випадковому виборі телефонних номерів. У 1936 р. У старшого середнього класу та заможних були телефони. У цій групі переважали республіканці, які прагнуть голосувати за республіканського кандидата. Рузвельт виграв зсув, отримавши свої голоси від бідних та середнього класу, які, як правило, були групою демократів! Це ілюструє упередженість із-за тонко поганого вибору кадру відбору проб.
Вибірковий опитування стосується кінцевих груп населення. Чисельність популяції - Н. Скажімо, проста випадкова вибірка взята з цієї сукупності і має розмір n. Для простоти припустимо, що тільки Обама та Ромні працюють. Частка голосів, які Обама отримав би за цю рамку вибірки, - це середнє значення бінарних змінних (скажімо, 1, якщо респондент вибирає Обаму, а 0 - Ромні). Середня дисперсія вибіркової середньої величини для цієї змінної дорівнює [p (1-p) / n] [Nn] / N, де p - справжній пропортен населення, який вибрав би Обаму. [Nn] / N - корекція кінцевої сукупності. у більшості опитувань N набагато більший, ніж N, і правильне можна ігнорувати. Дивлячись на p (1-p) / n, ми бачимо, що дисперсія знижується на n. Отже, якщо n великий, інтервал довіри на заданому рівні довіри буде малим.
Інші опитувальники опитування та статистики в Бюро перепису населення США мають у своєму розпорядженні ці статистичні інструменти, і вони використовують більш складні та точні методи (кластерна вибіркова вибірка та стратифікована випадкова вибірка, щоб згадати пару методів).
Коли їх припущення щодо моделювання справедливі, методи працюють надзвичайно добре. Яскравий приклад - вихід із опитування. У день виборів ви побачите мережі, які точно переможця проекту майже в кожному штаті задовго до остаточного підрахунку. Це тому, що мінливості дня передвиборів вже відсутні. Вони історично знають, як люди прагнули голосувати, і вони можуть визначати вибрані дільниці таким чином, щоб уникнути упередженості. Мережі колись відрізняються. Це може бути пов'язано з змаганням вибрати переможця попереду ментальності інших. У рідкісних випадках це також може бути, оскільки голосування надзвичайно близьке (наприклад, президентські вибори 2000 року у Флориді).
Я сподіваюся, що це дасть вам чіткішу картину того, що відбувається. Ми більше не бачимо грубих помилок, таких як "Дьюї перемагає Трумена" 1948 року або фіаско "Літературного дайджесту" 1936 року. Але статистика не є досконалою, і статистики ніколи не можуть сказати, що вони впевнені.