Опитування: чи є 25% великого представника бази користувачів?


13

В даний час мій роботодавець проводить опитування компанії про ставлення до офісу, тобто про почуття. У минулому вони відкрили опитування для всіх напрямків бізнесу (припустимо, 10 дуже різних відділів) та всіх працівників у них (Припустимо, загалом 1000 працівників у всій компанії) Кількість працівників у кожному відділі не однакова і одна певний відділ, ймовірно, складає 50% від загальної кількості організацій.

Цього року опитування відкривається лише для 25% від загальної кількості працівників, а вибір - випадковий

Отже, у мене є два запити:

  • Якщо це дійсно випадковий відбір всієї бази співробітників, то як це статистично достовірний зразок, який передбачає, що всі ці працівники відповіли?

  • Якщо він є випадковим на рівні кожного відділу, наприклад, 25% кожного відділу, то як допустимий зразок, що враховує один відділ, становить понад 50% від загальної кількості населення.

Я міг би припустити, що для визначення настрою більшості в компанії, потрібно мати принаймні 50% бази працівників у кожному відділі, щоб забезпечити справжнє почуття читання.

Оновлення : опитування не застосовується. Не може бути гарантовано 100% відповіді від 25% вибраних. Не існує жодних заохочувальних чи каральних засобів, якщо опитування є чи не заповнене.


2
Я б запропонував зробити опитування таким невеликим (кількість / тип запитань), як це потрібно, а потім зробити його обов'язковим для тих кількох, скільки вам потрібно, щоб співробітники / менеджери не скаржилися, що це гігантський час смоктання. Якщо люди самостійно вибирають, це гарантує систематичне зміщення певної форми.
Нік Т

Якщо ви вимірюєте середнє значення деякої змінної, яка зазвичай розподіляється, то приблизно через 20 відповідей розмір вашого +/- інтервалу зросте зі швидкістю приблизно 1/sqrt(# responses). Наприклад, з 20 відповідями у вас буде +/- .468 * sigma. Зі 100 відповідями це буде +/- .198 * sigma. З 1000 відповідями це буде +/- .062 * sigma.
Темп

Відповіді:


22

Подумайте про опитування серед загальної сукупності скажімо США. Якщо нам потрібно 50% населення для визначення думки більшості, нам знадобиться вибірка в розмірі близько 160 мільйонів, що є справді непосильним. Навіть зразок 1% надзвичайний (близько 3,2 мільйона), і це робиться рідко. Важливе опитування в американському загальноосвітньому опитуванні має розміри вибірки від 1500 до майже 3000. Тож 25% вибірка сама по собі не є проблемою.

Пам’ятайте, що опитування - це не вибори чи референдум. Щоб остання була законною, кожна особа, яка має право на участь, повинна мати можливість сказати свою думку. Метою опитування є отримання хорошої оцінки середньої думки, і це можна отримати за допомогою випадкової вибірки. Тож компанії потрібно вирішити, яка мета опитування: чи це спосіб працівники висловити свою думку та взяти участь у компанії, чи це спосіб отримати менеджерами інформацію?

Обидві конструкції вибірки забезпечують запит 25% працівників. Останнє забезпечує, що менші відділи представлені в опитуванні. Якщо ви ставитеся до стандартних помилок, то вам слід врахувати вкладений характер вибірки, хоча я не підозрюю, що це буде мати велике значення в цьому випадку.


2
+1, але варто підкреслити, що якщо вас не цікавить "середня думка", а щось інше, тоді можуть знадобитися більші зразки.
Тім

1
Дякую за відповідь. Однак, і це був мій упущення, примусового виконання опитування немає. Лише 25% будуть запитуватися, але вони не зобов'язані відповідати.
Колін

2
Це теж нормально. Якщо я проведу опитування, важко буде змусити людей відповісти будь-яке. Я міг би спробувати найняти злочинців, щоб "переконати" моїх респондентів, але це матиме певні етичні та правові наслідки ... Тим не менш, невідповідь - це проблема, але це питання, з яким доводиться стикатися з більшістю опитувань.
Maarten Buis

7

За етимологією " опитування " ( sur-від "супер", як "зверху" та -vey"погляд") означає огляд , а не повну картину.

До тих пір, поки 25% були справді випадковими, а не самостійно обраними (відмовились), то це цілком відповідає визначенню цього терміна. Якщо опитування не є обов'язковим, то відповіді будуть репрезентативними лише для тих, хто відчуває потребу відповісти. Наприклад, уявіть собі ресторан, в якому можна було б заповнити карту зворотного зв'язку після обіду. Навіть якщо більшість ресторанів задоволені, більшість відгуків будуть негативними, оскільки щасливі клієнти бачать мало підстав для надання відгуку.


1
Чи можете ви розширити ефект "самовибору"? Це опитування не застосовується, воно є абсолютно необов’язковим, і немає заохочувальних чи каральних засобів, якщо ви це робите чи не заповнюєте. Я оновлю своє вступне запитання.
Колін

6
@Colin: Якщо опитування необов’язкове, відповіді будуть репрезентативними лише для тих, хто відчуває потребу відповісти. Наприклад, уявіть собі ресторан, в якому можна було б заповнити картку зворотного зв'язку після обіду. Навіть якщо більшість ресторанів задоволені, більшість відгуків будуть негативними, оскільки щасливі клієнти бачать мало підстав для надання відгуку.
dotancohen

1
@dotancohen Я думаю, що відповідь дуже корисно отримає від включення цього коментаря.
Пер

@Pere: Спасибі, я хвилювався, що введення коментаря у відповідь може відвернути етимологічну точку. Але ти маєш рацію, і я додаю це.
dotancohen

4

Інша точка зору виходить з теорії дизайну експерименту.

Статистична потужність - це ймовірність пошуку ефекту, якщо вона реальна ( джерело )

Чотири фактори впливають на потужність:

  1. Розмір ефекту
  2. Стандартне відхилення характеристики
  3. Більший розмір вибірки
  4. Бажаний рівень значущості

На основі цих елементів можна написати формальне математичне рівняння, яке стосується потужності, розміру вибірки, розміру ефекту, стандартного відхилення та рівня значущості ( джерело )

Згідно з набором припущень , ви можете охарактеризувати опитування як експеримент і скористатися дизайном рамки експерименту ( тут є кілька прикладів). Існує цілий ряд освічених здогадів; однак, недосконала модель може бути кращою, ніж взагалі жодна модель.


3

Я відчуваю два питання. Один про розмір вибірки (25%, чому не більшість) та інший про техніку відбору проб (чи це справді випадковий вибірки 25% випадковим чином по всій компанії, вибірка 25% випадковим чином у кожному відділі чи використання іншої дистрибуції).

1) Розмір вибірки не повинен бути більшістю. Необхідний розмір вибірки може бути будь-яким від 0 до 100% залежно від необхідної точності для заданого коефіцієнта достовірності або ймовірності.

100% впевненість ніколи не отримується (також не з 50% або більшим набором). Досягнення такої високої точності також не є сенсом вибірки та оцінки.

Дивіться більше про розміри зразків: https://en.wikipedia.org/wiki/Sample_size_deterication

Якщо ви знайдете закон великої кількості, ви також можете мати інтуїтивне уявлення.

Розподіл середніх значень для всіх можливих підмножин (і ваш зразок буде одним із них) стане менше і ближче до середнього значення вихідного розподілу, якщо розмір підмножини збільшиться. Якщо ви обираєте одну людину, то є певний розумний шанс виявити виняток, але знайти той самий виняток у тому ж напрямку двічі стає менш імовірним. І так далі, чим більший розмір вибіркової підмножини, тим менший шанс виняткового підмножини.

n

Важлива примітка! Ваша оцінка буде залежати не від чисельності населення, з якого ви берете вибірку, а від розподілу цієї сукупності.

Що стосується вашого відділу розміром 500. Відхилення середніх значень випадкових підмножин (розміром 125) буде в 11 разів менше, ніж початкове відхилення. Зауважимо, що похибка вимірювання (відхилення від середнього значення випадково вибраних підмножин) не залежить від розміру відділу. Це може бути 500, 5000 або 50000, у всіх випадках оцінка не вплине, якщо вони мають однаковий розподіл (зараз крихітний відділ може мати дивний розподіл, але це починає зникати для більших груп).

2) Вибірка не повинна бути повністю випадковою. Ви можете врахувати демографічні показники.

Врешті-решт, ви б ставились до кожного відділу окремо в такому вигляді аналізу та виправляли б варіанти між відділами та те, як ви взяли вибірки в цих, різних розмірах, відділах.

У цій корекції є дві важливі диференціації. Можна вважати розподіл між групами як випадкову змінну чи ні. Якщо ви трактуєте це як випадкову величину, то аналіз стає сильнішим (виймаючи певні ступені свободи в моделі), але це може бути помилковим припущенням, якщо різні групи не можуть бути замінені як випадкові сутності без конкретного ефекту (що, здається, є ваш випадок, як я думаю, що відділи виконують різні функції і можуть мати сильно різні настрої, що не є випадковими по відношенню до відділу).


1
Дякую за відповідь. Однак, і це був мій упущення, примусового виконання опитування немає. Лише 25% будуть запитуватися, але вони не зобов'язані відповідати.
Колін

1
Потім виникає додаткове третє запитання про методи вибірки та спосіб збирання даних. На такі проблеми, як боротися з невідповідними та іншими аспектами якості даних, немає однозначної відповіді. У будь-якому випадку (або із запитанням 50%, або 25%), якщо є велика проблема з відповіддю, то будь-яке обговорення статистичного аналізу має лише другорядне значення. Ви не покращите це дослідження значно більше (наприклад, запитування> 50%) вибірки, і краще зосередитись на хорошому відборі.
Секст Емпірік

2

Ваше запитання щодо розміру вибірки для кінцевої сукупності. Але перше, що вам потрібно - це розмір вибірки, необхідний для нескінченної сукупності, який потім може бути використаний для обчислення розміру вибірки для кінцевої сукупності.

n=(z2pq)/d2
n
z2
p
q=1p
d2

(1.96×0.5×0.5)/0.032=1,068

m=n/(1+((n1)/N))
m
n
N

N=1,0001068/(1+((10681)/1000))=517

Якщо ви використовували 25% населення, рівень помилок виходить як 5,4%. Цей рівень помилок може бути нормальним на основі попередніх опитувань. За допомогою опитувань завжди відбувається розмиття між рівнем помилки, який ви готові прийняти, та витратами на проведення опитування.

517/0.65=796

Речі стають складнішими, якщо ви хочете розділити населення за відділами (відомий як стратифікація). В основному, вам потрібно ставитися до кожного відділу як до окремої кінцевої сукупності, якщо ви хочете, щоб дані були точними для кожного відділу, що може не бути практичним. Але ви можете зробити стратифіковану випадкову вибірку замість простої випадкової вибірки, де 50% вибірки відбирається випадковим чином з відділу з 50% населення, а відповідні відсотки вибірково відбираються з інших відділів. Це означатиме, що розмір вибірки трохи збільшиться, тому що вам потрібно округлювати всі десяткові знаки вгору (ви не можете оглянути 0,1 людини). Однак результати слід перевірити на рівні населення (компанії), а не на рівні відділу, оскільки відповідей кожного відділу не буде достатньо, щоб бути точними.


1

Говорячи про дійсний зразок, базове поняття зазвичай є представленням. Чи адекватно "вибірка" представляє населення? Для отримання репрезентативної вибірки потрібно переконатися, що розмір вибірки є адекватним (щоб зменшити дисперсію оцінки), а також, що вибірка містить членів, що належать до підмножини населення, що демонструють різні типи поведінки на розгляді.

По-перше, частка користувачів, відібраних для опитування, має значення меншою порівняно з абсолютною кількістю вибраних користувачів. Необхідний розмір вибірки буде залежати від вимоги точності та довірчого інтервалу у наданій відповіді. Ви можете прочитати цю статтю для отримання додаткової інформації.

Ви згадуєте, що компанія складається з декількох відділів. Чи ймовірно, що відділи різняться у відповідях на опитування? Якщо вони це роблять (або, можливо, ви цього точно не знаєте), було б гарною ідеєю "розшаровувати" ваш зразок по відділах. У своїй найпростішій формі це означає підібрати рівну частку людей з кожного відділу. Напр .: розмір компанії - 1000, а обраний розмір вибірки - 100. Тоді ви вибрали б 50 з відділу розміром 500, 10 - з відділу розміром 100 і т.д. Це дозволяє уникнути недостатнього представництва певного відділу в будь-яку конкретну "випадкову" вибірку.

Ви також згадуєте, що не всі можуть відповісти на опитування. Якщо ви знаєте, що приблизно половина людей відповість, то для отримання 100 відповідей вам доведеться надіслати опитування до 200 осіб. Вам доведеться врахувати можливість того, що такі відповіді можуть бути упередженими. Люди з певною реакцією можуть бути більш-менш схильні відповідати.


1

Якщо це дійсно випадковий відбір всієї бази працівників , то як це статистично достовірний зразок, який передбачає, що всі ці співробітники відповіли?

Це дійсна вибірка, доки вона взята з популяції, яку вона має на меті описати. Тобто, якщо ви лише зразки начальників, нічого не можна сказати про інших працівників; це не відбудеться в налаштуваннях, які ви описали. Однак це може статися через невідповідь (докладніше про це нижче).

Якщо він є випадковим на рівні кожного відділу, наприклад, 25% кожного відділу, то як допустимий зразок, що враховує один відділ, становить понад 50% від загальної кількості населення.

Це вже не питання достовірності вибірки, а помилки вибірки. Очевидно, що найточніші оцінки отримали б із стратифікованого випадкового розіграшу, прошарок охоплював принаймні рівень відділу. У таких умовах у вас буде дійсна вибірка для кожного відділу, але оцінки для невеликих відділів, як правило, менш точні, ніж оцінки для великих відділів, завдяки більшому абсолютному розміру вибірки для останнього. Для загальної організації більш високе представництво вибірки у більших відділах просто відображає реальність організації і жодним чином не знижує обґрунтованість вибірки.

Обстеження не виконується. Не може бути гарантовано 100% відповіді від 25% вибраних. Не існує жодних заохочувальних чи каральних засобів, якщо опитування є чи не заповнене.

Ви не зможете когось змусити дати хорошу відповідь, але реалізація плану нагадування відповідей - мінімум. Плюс слід пояснити важливість опитування для працівників та їх вплив, який вони можуть мати на організацію завдяки опитуванню: наприклад, коли публікуються результати? які потенційні дії, які здійснює організація на основі опитування? чому кожна відповідь має значення?

Після збору даних невідповідь - це питання, з яким слід вирішити. Якщо мати справу з цим, ви повинні спочатку проаналізувати поведінку без відповідей, щоб виявити будь-які можливі зразки: чи не відповів начальник? Чи даний відділ взагалі не відповів? Потім прийняти необхідну стратегію (постстратифікація, перенавантаження, імпутація тощо).


1

Я розкриваю відповідь @ICannotFixThis на прикладі того, як важливі чотири фактори:

  1. Розмір ефекту
  2. Стандартне відхилення характеристики
  3. Більший розмір вибірки
  4. Бажаний рівень значущості

Як ці фактори впливатимуть на ваші результати, залежатиме від статистики, яку ви використовуєте. Наприклад, якщо ви хотіли відгадати середнє значення якоїсь змінної, ви можете скористатися тестом Стьюдента .

Припустимо, ви хочете визначити середній зріст своїх співробітників за допомогою цього опитування. Ви насправді не знаєте стандартного відхилення висоти всіх співробітників вашої компанії (не вимірюючи всіх), але ви можете зробити деякі дослідження і здогадатися на 3 дюйми (це приблизно стандартне відхилення висоти для чоловіків у США).

Якщо ви опитували лише 5 людей, то 95% часу середній зріст, який ви спостерігаєте у своєму опитуванні, буде в межах 3,72 дюйма від справжнього середнього зросту.

Тепер, як наші фактори впливають на це:

  1. Якщо вам потрібно дуже точно знати середню висоту (наприклад, розмір ефекту дуже малий), тоді вам знадобиться велика кількість зразків. Наприклад, щоб знати справжню середню висоту в межах 2,66 дюйма, вам потрібно було б оглянути 100 людей.

  2. Якщо стандартне відхилення велике, то точність, яку ви можете отримати, буде обмежена. Якщо стандартне відхилення склало 6 дюймів замість 3 дюймів, а у вас все ще було 5 відповідей, ви знали б лише 7,44 дюйма замість 3,72 дюйма справжню середню висоту.

  3. Пропуск цього пункту, оскільки це фокус усієї дискусії.

  4. Якщо вам справді потрібно бути впевненим, що ви маєте правильну відповідь, тоді вам потрібно буде обстежити більше людей. У нашому прикладі ми бачили, що за 5 відповідей ми могли отримати протягом 3,72 дюйма 95% часу. Якби ми хотіли бути впевненими, що наша відповідь була в правильному діапазоні 99% часу, то наш діапазон складе 6,17 дюйма, а не 3,72 дюйма.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.