Чому стверджується, що вибірка часто точніша за перепис?


13

При вивченні курсу вибірки я зустрічаю наступні два твердження:

1) Помилка вибірки призводить до більшої мінливості, помилки без вибірки призводять до зміщення.

2) Через помилку без вибірки зразок часто є більш точним, ніж ЦЕНЗАЛ.

Я не знаю, як зрозуміти ці два твердження. Яка основна логіка отримання цих двох тверджень?


5
Справжня перепис або спроба один?
кардинал

Відповіді:


16

Вибірка може бути більш точною, ніж (спроба) перепису населення, якщо факт перепису вправи збільшує ухил від помилки відбору проб. Це може статися, наприклад, якщо перепис породжує несприятливу політичну кампанію, яка виступає за невідповідь (з вибіркою трапляється щось менш ймовірно). Якщо цього не відбудеться, я не можу зрозуміти, чому, як можна очікувати, зразок матиме меншу помилку без вибірки, ніж перепис; і за визначенням вона матиме більше помилок вибірки. Тому, крім цілком незвичних обставин, я б сказав, що перепис буде більш точним, ніж вибірковий.

Розглянемо загальне джерело помилки, що не відповідає зміні, - систематичну невідповідь, наприклад, певною соціально-демографічною групою. Якщо люди з групи X, ймовірно, відмовляться від перепису населення, вони так само ймовірніше відмовитись у вибірці. Навіть з poststratification вибірки ваги до відповідей тих людей з групи X , які ви б переконати , щоб відповісти на ваші запитання, ви по- , як і раніше є проблеми , тому що ті можуть бути дуже сегмент X, які про-опитувань. Немає реального способу вирішити цю проблему, окрім того, щоб бути максимально обережним із дизайном інструменту та способом доставки.

Мимохідь це привертає увагу до однієї можливої ​​проблеми, яка може зробити спробу перепису менш точною, ніж вибірки. Зразки зазвичай мають постстратифікаційне зважування для населення, що пом'якшує проблеми з упередженням з таких питань, як, наприклад, у моєму пункті вище. Спроба перепису населення, яка не отримує 100% прибутку, є лише великою вибіркою і в принципі повинна піддаватися тій же обробці; але оскільки це сприймається як "перепис" (а не спроба перепису), цим можна знехтувати. Так що перепис може бути менш точним, ніж відповідний зважений зразок. Але в цьому випадку проблема полягає в техніці аналітичної обробки (або упущенні), а не в чомусь сутнісно тому, що це спроба перепису.

Ефективність - інша справа - як каже Мішель, добре проведений зразок буде більш ефективним, ніж перепис, і він може мати достатню точність для практичних цілей.


1
+1 Це відображає продумане та інформативне зусилля, щоб зрозуміти питання та що його мотивує.
whuber

Я думаю, що різниця між вибіркою та неповним переписом є більш ніж просто більшою схильністю до ваги відповідей у ​​вибірці. Зрештою, вагові показники мають звідкись походити - перепис чи вибірка вищої якості.
Джонатан

Я дійсно наголошу на здатності мінімізувати упередження без відповідей у ​​вибірці. Дуже небагато переписів населення здатне ефективно іти після упереджень без відповідей - навіть боротьба з переписом у США. Мабуть, єдині, хто може це зробити, - це опитування задоволеності працівників. Набагато вигідніше зайнятися невідповіддю на вибіркове опитування.
Джонатан

За переписом може бути дорогим контроль якості для кожного інтерв'ю / ...! Тому часто якість даних буде кращою у вибірці, ніж при переписі.
kjetil b halvorsen

5

Я думаю, що є практичні ситуації, коли зразок може бути більш точним. Наприклад, ми провели дослідження в місті в країні, що розвивається, з великою кількістю людей, які живуть у незареєстрованих місцях, і люди постійно приходять і їдуть і соромляться відповідати. Спроба фактично здійснити перепис населення вимагала б геркулеївських зусиль, і зважаючи на наші ресурси, це мало б бути зроблено протягом декількох місяців, коли люди приїжджали і збиралися. За допомогою вибірки ми могли б витратити більше часу на те, щоб ми наблизилися до максимально повного реагування - тому що ми могли пояснити, що ми робимо - і ми могли це зробити за набагато коротший часовий проміжок, який позбувся б проблеми. людей, які в'їжджають у місто та залишають його.

Так що я думаю, що відповідь залежить більше від логістики того, що ви робите, та різних джерел помилки вибірки.

Насправді, іншим джерелом було те, що наше опитування було складним, і нам довелося навчати інтерв'юерів, і знайти та фінансувати достатньо навчальних інтерв'юерів у цій країні було б дуже важко.


5

Під час відбору проб людей для опитувань, зразки часто страждають як від помилки вибірки (ми отримуємо лише оцінки), так і від відсутності вибіркової помилки (наприклад, люди, які відмовляються відповідати на опитування, не відбирають вибірку до вибіркового кадру, який потребує через практичні міркування, такі як вартість, або неможливість точно визначити сукупність, щоб зробити вибірку). Зроблено правильно, з високим рівнем відповідей вибірка є більш ефективною, ніж перепис. Але неправильно припускати, що жоден зразок не містить помилки збору.


+1. Дякую за вашу відповідь, Мішель, і ласкаво просимо до нашої спільноти!
whuber

1
Привіт джоубер, приємно бути тут. Дякуємо за прийом :)
Мішель

1
@Michelle Ще трохи виправлення. Помилка вибірки - це помилка, яка є результатом не вибору всієї сукупності, тобто помилки через використання вибірки для виведення характеристик сукупності. Помилка відбору проб - це все інше, включаючи невідповідь, невдачу створити адекватну рамку вибірки, помилки вимірювань тощо
Бретт

3

Я думаю, що вони є ключовими у відповіді Пітера Елліса: "спроба". Якщо ви правильно займаєтеся вибіркою, ви перебираєте деталі невідповіді, розраховуєте верстви та шукаєте їх і т. Д. Коли ви вирішили провести перепис, легко проігнорувати ці питання, оскільки ви отримуєте "всіх". Проблема в тому, що ти, мабуть, не всіх отримуєш, але ти не думаєш про те, кого ти насправді не отримуєш.

Існують також статистичні питання з надзвичайно великими вибірками (як частка вибіркової сукупності). Я недостатньо складний, щоб їх зрозуміти, але, як мінімум, у вас проблеми з розрахунками дисперсії. (Такі пакети, як R, surveyкомпенсують такі речі у великих підгрупах опитування, і саме там я вперше дізнався про це.)

В якості другого питання, якщо помилка без вибірки включає проблеми, пов’язані з контролем якості на різних етапах процесу, наявність надзвичайно більшої кількості даних (перепису) значно ускладнить би рівень контролю якості, який у вас був би (з тим же ресурси) на менший набір даних (зразок).

Уявіть, якби у вас були ресурси (фінансові та кадрові), які Бюро перепису населення використовувало для перепису, але ви проводили лише опитування 1000 випадкових дорослих. Я думаю, у вас буде набагато кращий контроль якості та набагато кращий аналіз проблем, що стосуються, та самих даних.


2

Я вважав, що причина вибірки може бути (не є) точнішою, ніж перепис, насправді мала один компонент, який можна віднести до характеру перепису порівняно з вибіркою, і який можна віднести до причини перепису, що може мати більшу зміщення (очевидно невибірка, за визначенням): за переписом кількість населення, як правило, невідома. Тож мінімізувати або контролювати зміщення без відповіді - це набагато складніше, ніж робити це із зразком відомого розміру.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.