Інтервали довіри та розмір вибірки?


9

Я абсолютно нова в статистиці та області довірчих інтервалів. Тож це може бути дуже тривіально або навіть здаватися дурним. Буду вдячний, якщо ви могли б допомогти мені зрозуміти або вказати на якусь літературу / текст / блог, що пояснює це краще.

Я бачу на різних новинних сайтах, таких як CNN, Fox news, Politico і т. Д. Про їх опитування щодо перегонів Президента США.

CNN: Популярність Обами становить X% з похибкою +/- x1%. Розмір вибірки 600. FOX: Популярність Обами становить Y% з похибкою +/- y1%. Розмір вибірки 800. XYZ: Популярність Обами становить Z% із похибкою +/- z1%. Розмір зразка 300.

Ось мої сумніви:

  1. Як вирішити, кому довіряти? Чи повинен він базуватися на довірчому інтервалі, чи слід вважати, що оскільки Fox має більший розмір вибірки, його оцінка є більш надійною? Чи існує неявна залежність між інервацією довіри та розміром вибірки таким чином, що вказівка ​​одного уникне необхідності вказувати інше?

  2. Чи можна визначити стандартне відхилення від довірчих інтервалів? Якщо так, то чи завжди він чи дійсний лише для певних розподілів (наприклад, Гаусса)?

  3. Чи є спосіб я "об'єднати" або "об'єднати" вищевказані три оцінки та отримати власну оцінку разом із довірчими інтервалами? Який розмір вибірки потрібно вимагати в такому випадку?

Я згадав CNN / Fox лише для того, щоб краще пояснити свій приклад. Я не маю наміру починати дебати проти демократів проти республіканців тут.

Будь ласка, допоможіть мені зрозуміти проблеми, які я порушив.

Відповіді:


4

Окрім чудової відповіді Петра, ось деякі відповіді на ваші конкретні запитання:

  1. Кому довіряти, також буде залежати від того, хто проводить опитування та які зусилля вони докладуть, щоб отримати якісне опитування. Більший розмір вибірки не кращий, якщо вибірка не є репрезентативною, взявши величезне опитування, але лише в одному, не розгорнутому стані не дало б дуже хороших результатів.

    Існує залежність між розміром вибірки та шириною довірчого інтервалу, але інші речі також впливають на ширину, наприклад, наскільки відсоток близький до 0, 1 або 0,5; які коригування зміщення використовувались, як брали зразок (кластеризація, стратифікація тощо). Загальне правило полягає в тому, що ширина довірчого інтервалу буде пропорційною , тому для вдвічі меншого інтервалу потрібно в 4 рази більший розмір вибірки.1н

  2. Якщо ви досить добре знаєте про те, як була зібрана вибірка та яка формула була використана для обчислення інтервалу, ви можете вирішити для стандартного відхилення (вам також потрібно знати рівень довіри, який використовується, як правило, 0,05). Але формула відрізняється для стратифікованих проти кластерних зразків. Також більшість опитувань дивляться на відсотки, тому використовували б біноміальне розподіл.

  3. Існують способи комбінування інформації, але вам, як правило, потрібно знати щось про те, як були зібрані зразки, або бути готовим зробити певну форму припущень щодо побудови інтервалів. Байєсівський підхід - це один із способів.


1
+1. Але чи є прогноз №3 насправді таким похмурим чи складним? Якщо у мене є колекція незалежних оцінок, кожна з яких має свою похибку, чому я не можу (принаймні приблизно) комбінувати їх звичайним чином (як середньозважене значення, зважене навпаки у квадратних МО) та поєднувати їх стандартні помилки як добре (використовуючи дисперсійні формули)? Це не було б ідеально, але це повинно бути краще, ніж вибрати одне опитування, на яке спиратися, правда?
качан

Дякую Грег! Я дуже ціную ваші відповіді. Ви сказали у своїй відповіді на запитання 3, що "баєсовський підхід - це один із способів". Не могли б ви вказати мені якусь літературу, яка дає більше інформації про це?
Нік

@whuber: Дякуємо за ваш коментар. Саме це я і думав робити. Як ви вважаєте, виправдано поєднувати ці оцінки таким чином? Може бути не повністю, але значною мірою?
Нік

1
@whuber, я не мав на увазі зобразити це як похмурий, а лише переконатися, що плакат знає і може жити з необхідними припущеннями.
Грег Сноу

@Nik, в Інтернеті є багато підручників для байєсівської статистики. Простий підхід (який передбачав би, що всі вибірки були простими випадковими вибірками або що проект опитування був таким, що припущення SRS не за горами) було б почати з бета-версії до цього, а потім використовувати кожне опитування з двоматеріальною ймовірністю оновіть і отримайте нову задню частину. Одне приємне в підході Байєса - ви можете знизити ефект попередніх досліджень, якщо ви не хочете, щоб вони мали такий же вплив, як останні опитування.
Грег Сноу

4

Це величезна тема, але в основному є два питання:

1) Точність - це визначається розміром вибірки. Більші зразки дають більш точні оцінки з меншими стандартними похибками та більш жорсткими інтервалами довіри

2) Зсув - який, за статистикою, не обов'язково має негативні конотації, які він має в інших місцях. На опитуваннях вони намагаються отримати випадкову вибірку XXXX (іноді ймовірно виборців, іноді зареєстрованих виборців). Але вони цього не роблять. Деякі опитування використовують лише наземні лінії. Різні групи людей більш-менш ймовірно відповідають. Різні групи мають більш-менш шанси просто зависати.

Отже, всі опитувальники зважують свої відповіді. Тобто вони намагаються пристосувати свої результати, щоб відповідати відомим фактам про виборців. Але всі вони це роблять трохи інакше. Тож навіть при однакових вхідних даних опитування вони даватимуть різні цифри.

Кому довіряти? Що ж, якщо ви подивитесь на роботу Нейт Сілвер на 538, він має оцінки того, наскільки точними опитувальники були на попередніх виборах. Але це не означає, що вони будуть зараз однаково точними.


Дякую Петру. Тож оцінка з меншою похибкою є більш точною. Чи є також спосіб дізнатись, наскільки упереджено це лише від похибки X% +/- x1%? Я думаю, що це неможливо, якщо ви не знаєте переваг індивідуального зразка, правда?
Нік

Так, правильно. Звичайно, деякі опитувачі мають відомі упередження (в той чи інший бік). Внутрішні опитування (керовані однією чи іншою стороною) часто є необ’єктивними. Один із способів зробити це - це провести кілька опитувань і звільнити лише ті, що сприятливі. Тоді є цілий випуск "поштових опитувань", в якому питання про кандидата передують негативні питання про нього чи її.
Пітер Флом

1

Це потрапляє в область вибіркового обстеження. В принципі, методи працюють, оскільки використовується рандомізація. Ось речі, які можуть відрізнятися в опитуваннях на основі суб'єктивних рішень.

  1. Рамка для відбору проб. З якої групи виборців я повинен взяти свій зразок?

  2. Як мені впоратися з мінливістю нерішучого виборця, який може змінити свою думку щодо Обами проти Ромні на основі вчорашнього опитування чи наступних тижнів?

  3. Петро торкнувся упередженості. Опитування літературних дайджестів 1936 року було катастрофою. Він обрав республіканського кандидата у FDR, оскільки кадр вибірки базувався на випадковому виборі телефонних номерів. У 1936 р. У старшого середнього класу та заможних були телефони. У цій групі переважали республіканці, які прагнуть голосувати за республіканського кандидата. Рузвельт виграв зсув, отримавши свої голоси від бідних та середнього класу, які, як правило, були групою демократів! Це ілюструє упередженість із-за тонко поганого вибору кадру відбору проб.

  4. Вибірковий опитування стосується кінцевих груп населення. Чисельність популяції - Н. Скажімо, проста випадкова вибірка взята з цієї сукупності і має розмір n. Для простоти припустимо, що тільки Обама та Ромні працюють. Частка голосів, які Обама отримав би за цю рамку вибірки, - це середнє значення бінарних змінних (скажімо, 1, якщо респондент вибирає Обаму, а 0 - Ромні). Середня дисперсія вибіркової середньої величини для цієї змінної дорівнює [p (1-p) / n] [Nn] / N, де p - справжній пропортен населення, який вибрав би Обаму. [Nn] / N - корекція кінцевої сукупності. у більшості опитувань N набагато більший, ніж N, і правильне можна ігнорувати. Дивлячись на p (1-p) / n, ми бачимо, що дисперсія знижується на n. Отже, якщо n великий, інтервал довіри на заданому рівні довіри буде малим.

Інші опитувальники опитування та статистики в Бюро перепису населення США мають у своєму розпорядженні ці статистичні інструменти, і вони використовують більш складні та точні методи (кластерна вибіркова вибірка та стратифікована випадкова вибірка, щоб згадати пару методів).

Коли їх припущення щодо моделювання справедливі, методи працюють надзвичайно добре. Яскравий приклад - вихід із опитування. У день виборів ви побачите мережі, які точно переможця проекту майже в кожному штаті задовго до остаточного підрахунку. Це тому, що мінливості дня передвиборів вже відсутні. Вони історично знають, як люди прагнули голосувати, і вони можуть визначати вибрані дільниці таким чином, щоб уникнути упередженості. Мережі колись відрізняються. Це може бути пов'язано з змаганням вибрати переможця попереду ментальності інших. У рідкісних випадках це також може бути, оскільки голосування надзвичайно близьке (наприклад, президентські вибори 2000 року у Флориді).

Я сподіваюся, що це дасть вам чіткішу картину того, що відбувається. Ми більше не бачимо грубих помилок, таких як "Дьюї перемагає Трумена" 1948 року або фіаско "Літературного дайджесту" 1936 року. Але статистика не є досконалою, і статистики ніколи не можуть сказати, що вони впевнені.


Дякую за детальне пояснення. Це справді допомогло!
Нік

Ми більше не бачимо грубих помилок? Тож Клінтон виграла у 2016 році, чи не так? Я беру твої відомі невідомі і піднімаю тобі чорного лебедя . Як казав мій тато, "Це те, чого ти не знаєш, вбиває тебе".
Карл

1
Моя відповідь не мала нічого спільного з Клінтоном та виборами 2016 року, які мали багато дивних питань. (1) Російська інтервенція, (2) Клінтон виграла всенародне голосування і (3) деякі виборці Трампа схилялися визнати, що вони будуть голосувати за Трампа. Можливо, слід додати, що опитування можуть бути помилковими, коли явка виборців - це не те, що очікувалося.
Майкл Р. Черник
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.