Чи має сенс обчислювати довірчі інтервали та перевіряти гіпотези, коли дані цілої сукупності доступні?


10

Чи є сенс обчислювати довірчі інтервали та перевіряти гіпотези, коли дані доступні для всієї сукупності? На мою думку, відповідь - ні, оскільки ми можемо точно обчислити справжні значення параметрів. Але тоді, яка максимальна частка даних від вихідної сукупності дозволяє нам використовувати вищезгадані методи?


3
Якщо ви використовуєте правильні методи кінцевої вибірки, дисперсія переходить до нуля саме тоді, коли ваша вибірка досягає розміру сукупності. Тобто немає максимального розміру; правильні формули працюють , як вони повинні, аж до . н=N
Glen_b -Встановити Моніку

Я думаю, ви повинні викласти це більш чітко, якщо мова йде про випадок "вибірка = кількість населення" або "вибірка з обмеженою сукупністю".
ttnphns

Перша частина питання стосується вибірки = популяція, а друга - вибірки від популяції (коли розмір вибірки <кількість населення).
Мирослав Сабо

Відповіді:


9

Перше питання - це питання, на яке не існує загальнозгодженої відповіді. Мій власний погляд є як ваш, але інші стверджують, що населення можна розглядати як зразок "суперпопуляції", де точний характер суперпопуляції змінюється залежно від контексту: наприклад, перепис усіх людей, які живуть у будівлю можна розглядати як зразок усіх людей, що живуть у подібних будівлях; перепис населення США (не те, що ніколи не може бути по-справжньому повноцінним) може розглядатися як зразок із супернаселення американців, яке одного дня може існувати (або щось подібне). Я думаю, це часто є приводом для використання p-значень; багатьом науковцям в предметних галузях не зручно, якщо вони не отримали р-значення. (Але це мій погляд).

Друге питання видається дещо дивним, щоб відповісти загальним чином. Коли ви отримуєте зразок, який (скажімо) навіть більше половини населення?

Більшою проблемою буде упередженість. Повертаючись до перепису США, проблема полягає не лише в тому, що він сумує за людьми, а в тому, що люди, яких він сумує, не є випадковою вибіркою всього населення; тож навіть якщо перепис отримує відповіді (щоб вибрати число) 95% усіх людей, якщо ці 5%, що залишилися, зовсім інші, то результати будуть упередженими.


1
Я думаю, від того, чи ви обчислюєте інтервали довіри для статистики популяції, залежить від того, чи хочете Ви робити висновки щодо фактичної сукупності чи для гіпотетичної "супернаселеності". На минулій роботі з відділом охорони здоров'я ми повідомляли про щорічну статистику, як дуже низький відсоток ваги при народженні та рівень самогубств, що піднімався з року в рік. Так, ми звітували про все населення, але було б нерозумно зависати прогресом (і фінансуванням) держави щодо кожного збільшення або зменшення цих та інших показників охорони здоров'я як повного зміни стану здоров'я населення.
RobertF

7

Припустимо, що лише 2 з 12 членів комітету - жінки.

16

Або це може сприйматися як оцінка ймовірності того, що жінка буде обрана до складу комітету - властивість процесу відбору. Ви можете встановити довірчі інтервали навколо нього, перевірити, чи він суттєво відрізняється від половини (або іншої відповідної нульової гіпотези) тощо. Можливо, процес потрібно змінити, щоб зробити його справедливим.

Два погляди, описові та інфекційні, не є суперечливими, але досить виразними.

Відповідь на друге питання полягає в тому, що має сенс обчислювати довірчі інтервали для & тестування гіпотез про параметр популяції, навіть якщо лише одна людина не є вибіркою. Зауважте лише, що КІ та тести повинні враховувати значну частину вибірки населення : див .

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.