Модель вибірки для переповнених даних?


18

Я працюю над заявкою на відкрите опитування здоров’я, яку планують використовувати в країні, що розвивається.

Основна ідея полягає в тому, що інтерв'ю для опитування є переповненим - вони проводяться неорганізованими волонтерами, які подають форми даних інтерв'ю, які вони виконували, використовуючи свої мобільні пристрої, а кожне опитування супроводжується GPS-даними місця інтерв'ю.

Традиційні опитування, складені державними установами, зазвичай проводяться за допомогою стандартної моделі вибірки - зазвичай, моделі вибіркової ймовірності. Для цього потрібно багато централізованого планування, яке не завжди можна виконати. (згадав це, щоб поставити моє запитання в правильний контекст)

Можна сказати, що волонтер здійснюватиме вибірку зручності навколо своєї області. Він опитатиме довільно кількість людей, до яких може звернутися.

Основна проблема полягає в тому, як можна зрозуміти та охарактеризувати загальну модель вибірки цієї системи обстеження? Чи є методики чи складені моделі для вирішення таких випадків?

Відповіді:


15

Коротка відповідь: Це зразок зручності. Ви нічого не можете зробити, щоб це виправдати.

Дещо довша відповідь: ви перебуваєте в одному човні, як і багато соціальних мереж, які проводять свої внутрішні опитування, не маючи особливої ​​ідеї щодо того, хто відповість на опитування з одним запитанням, яке з'явиться випадковим чином у Facebook чи Google + ... за винятком того, що ви, на відміну від цих гігантів, не знаєте Не маю даних про тих, хто не відповів. Спільнота опитування та дослідження громадської думки, як правило, нахмурилася на цей вид роботи, оскільки зовсім не ясно, як результати цього сильно упередженого зразка можна узагальнити до загальної сукупності (якщо вона взагалі є). Ви можете спробувати набрати вагу відповідно до відомих демографічних даних, але тоді ви закінчите варіювання ваг від 1 для людини, яка представляє лише 1 000 000, присвоєного єдиному чоловікові серед населення 70+, який вміє користуватися комп'ютером (і, швидше за все, не є представником решти 1 000 000 чоловіків 70+).

Додаткове читання: "Як зв'язатись зі статистикою" відкривається розділ про упереджені вибірки. Якщо ви можете прочитати його і не плакати від розчарування щодо вашого зразка дизайну, ви можете рухатися далі. Якщо ви покладаєтесь на добровольців, ваш зразок має бути упередженим щодо молодого та міського населення з кращим доступом до електронних гаджетів. Аналогічно, буклет "Що таке опитування", складений Фріцем Шереном, минулим президентом Американської статистичної асоціації, відкриває картину Гаррі Трумена, перемогу якої не можна було передбачити за допомогою упереджених методів опитування, які існували на той час.

Є кілька досліджень щодо важкодоступних груп населення . Одним з відомих проектів було дослідження кількості надмірних випадків смерті в Іраку, де були відібрані географічні райони, і в кожному районі місцевий лікар намагався б взяти інтерв'ю у кожного домогосподарства у міському кварталі. Існує гостра критика цього дизайну, але як би це не було компрометацією, він все ще мав свій компонент вибірки. Дивіться статті в Ланцеті (як ви, напевно, знаєте, ви не можете отримати більш престижних в медичному світі) http://dx.doi.org/10.1016/S0140-6736(04)17441-2 та http: //dx.doi .org / 10.1016 / S0140-6736 (06) 69491-9 .


(+1) Стас, чи є щось принципово відмінне від вибірки квот ? Просто цікаво, побіжне читання питання робить це схожим лише на зміну термінології. Крім того, коротко, які основні критичні дані щодо дослідження вибірки кластерів в Іраку? Я пам’ятаю, як це бачив, коли вперше вийшов і трохи прочитав на ньому.
кардинал

Думаю, одна різниця полягає в тому, що немає квоти на особу ...;)
кардинал

Велике спасибі! Тепер я добре розуміюсь, перш ніж переробляти ідею!
al-Amjad Tawfiq Isstaif


Я думаю, що були проблеми з малою кількістю кластерів, і один кластер закінчив чужий світ, де військова активність була набагато вище, ніж де-небудь в країні. Для мене, перше, на що слід звернути увагу, - це заяви AAPOR та ASA про дослідження. Хоча Ланцет може бути чудовим медичним журналом, а Джон Хопкінс, чудовий медик, нюхав авторитет AAPOR і заперечував їх, документи з методології були просто непрофесійними.
Стаск
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.