Статистичний висновок, коли вибіркою "є" сукупність


47

Уявіть, що ви повинні звітувати про кількість кандидатів, які щорічно проходять тест. Здається, досить складно зробити висновок про спостережуваний відсоток успіху, наприклад, на більш широкій сукупності через специфіку цільової сукупності. Тож ви можете врахувати, що ці дані представляють всю сукупність.

Чи є результати тестів, які свідчать про те, що пропорції чоловіків і жінок є різними, справді правильні? Чи здається, що тест, який порівнює спостережувані та теоретичні пропорції, є правильним, оскільки ви вважаєте цілу сукупність (а не вибірку)?

Відповіді:


31

З цього приводу можуть бути різні думки, але я б ставлюся до даних про населення як до вибірки і припускаю гіпотетичну сукупність, а потім робити умовиводи звичайним чином. Один із способів задуматися над цим - це те, що існує основний процес генерації даних, що відповідає за зібрані дані, розподіл "населення".

У вашому конкретному випадку це може мати ще більший сенс, оскільки ви матимете когорти в майбутньому. Тоді ваше населення справді когорти, які здають тест навіть у майбутньому. Таким чином, ви можете врахувати часові зміни, якщо у вас є дані більше року, або спробувати врахувати приховані фактори через вашу модель помилок. Коротше кажучи, ви можете розробити більш багаті моделі з більшою пояснювальною потужністю.


4
Щойно натрапив на цю публікацію від A Gelman: Чи відрізняється статистичний аналіз при аналізі всього населення, а не вибірки? , j.mp/cZ1WSI . Хороший вихідний пункт для розбіжностей у думках щодо поняття "надселення".
chl

2
@chl: цікаво - нагадує мені, що Гельман в своїй роботі про ANOVA [ stat.columbia.edu/~gelman/research/publish/econanova3.pdf обговорював обмеження щодо обмеженого / надмірного населення, порівнянне з фіксованими / випадковими ефектами. ].
ars

+1 Я просто знову повернувся до цього (через google). Я вважаю, що ваша відповідь не на місці.
Шейн

25

Насправді, якщо ви справді позитивні, у вас все населення, навіть не потрібно запускатись у статистику. Тоді ви точно знаєте, наскільки велика різниця, і немає жодної причини перевіряти її більше. Класичною помилкою є використання статистичної значущості як "відповідної" значущості. Якщо ви відібрали чисельність населення, різниця полягає в тому, що це таке.

З іншого боку, якщо ви переформулюєте свою гіпотезу, то кандидатів можна розглядати як вибірку можливих кандидатів, яка б дозволила провести статистичне тестування. У цьому випадку ви б загалом перевірили, чи відрізняються самці та жінки від тесту, який є у вас.

Як говорили арс, ви можете використовувати тести кількох років і додавати час як випадковий фактор. Але якщо ваш інтерес справді полягає в відмінностях між цими кандидатами на цьому конкретному тесті, ви не можете використовувати узагальнення та тестування безглуздо.


15

Традиційно статистичний висновок викладається в контексті імовірнісних вибірок та характеру помилки вибірки. Ця модель є основою для перевірки значущості. Однак є й інші способи моделювання систематичних відхилень від випадковості, і виявляється, що наші параметричні (на основі вибірки) тести, як правило, є хорошими наближеннями цих альтернатив.

Параметричні тести гіпотез покладаються на теорію вибірки для отримання оцінок ймовірної помилки. Якщо вибірку заданого розміру беруть у сукупності, знання систематичного відбору вибірки робить тестування та довірчі інтервали значущими. Для населення теорія вибірки просто не має значення, і тести не мають сенсу в традиційному розумінні. Висновок марний, робити що робити не можна, є лише річ ... сам параметр.

Деякі з них долають це, звертаючись до супернаселення, яке представляє нинішній перепис населення. Я вважаю ці заклики непереконливими - параметричні тести базуються на вибірковому обліку ймовірностей та його характеристиках. Населення в даний момент може бути зразком більшої кількості населення за часом та місцем. Однак я не бачу жодного способу, який би міг законно стверджувати, що це випадкова (або взагалі будь-яка форма ймовірності) вибірки. Без вибірки ймовірностей теорія вибірки та традиційна логіка тестування просто не застосовуються. Ви можете так само добре протестувати на основі зручності.

Зрозуміло, щоб прийняти тестування при використанні сукупності, нам потрібно відмовитися від основи цих тестів у процедурах вибірки. Один із способів зробити це - визнати тісний зв’язок між нашими вибірко-теоретичними тестами - такими як t, Z та F - та процедурами рандомізації. Тести на рандомізацію ґрунтуються на вибірці. Якщо я збираю дані про доходи чоловіків і жінок, модель ймовірності та основа для наших оцінок помилок - це повторні випадкові розподіли фактичних значень даних. Я міг би порівняти спостережувані відмінності по групах з розподілом на основі цієї рандомізації. (Ми робимо це весь час в експериментах, до речі, де випадкова вибірка з популяційної моделі рідко підходить).

Тепер виявляється, що вибірко-теоретичні тести часто є хорошими наближеннями тестів рандомізації. Отже, в кінцевому рахунку, я вважаю, що тести для населення є корисними та значущими в цих рамках і можуть допомогти відрізнити систематичну від варіацій випадковості - подібно до тестів на основі вибірки. Логіка, яка використовується для цього, дещо інша, але це не має особливого впливу на практичний зміст та використання тестів. Звичайно, може бути краще просто використовувати тести рандомізації та перестановки безпосередньо, враховуючи, що вони легко доступні з усіма нашими сучасними обчислювальними можливостями.


3
+1 для розумного обговорення; кілька пунктів, хоча. Довідникові механізми недоступні для аналізу населення, але в багатьох випадках моделювання я б запитав, чи хтось коли-небудь має дані про кількість населення, починаючи з цього - часто не дуже складно пробивати дірки. Тож це не завжди звернення до суперсередовища як засобу розгортання висновку. Замість того, щоб "суперпопуляція", кращим способом є припущення, що процес генерування даних дає, наприклад, тест з року в рік з урахуванням конкретних груп. Ось тут і виникає стохастичний компонент.
АРС

2
Я не думаю, що тут немає жодних розбіжностей, за винятком відсутності вроджених механізмів для аналізу населення. Тести на рандомізацію застосовні до популяцій і можуть обґрунтовано перевірити, чи є ймовірним процес генерування даних через випадковий процес генерації порівняно з систематичним процесом генерації. Вони не передбачають випадкового вибірки і є досить прямим тестом на випадковість проти систематичної зміни. Наші традиційні тести, як правило, стоять для них досить добре.
Бретт

Це справжнє відношення: "відсутність інвентарної техніки". Необережне формулювання з мого боку, тим більше, що мені сподобалось те, що ви зробили щодо тестів на рандомізацію у своїй відповіді.
АРС

вибачте. У мене є труднощі зрозуміти, як я би розраховував перестановки та які висновки я зможу зробити для них.
pbneau

Чи не є коректною альтернативою завантажувальна програма? Яким чином завантажувальний процес не вдається вирішити необхідність зробити будь-яке з цих припущень?
Чернофф

3

Припустимо, результати показують, що кандидати відрізняються за статтю. Наприклад, частка тих, хто склав тести, така: 40% жінки та 60% чоловіків. Щоб сказати очевидне, 40% відрізняється від 60%. Тепер важливо вирішити: 1) чисельність вашого населення; 2) як ваші спостереження ставляться до населення, яке цікавить вас. Ось кілька деталей щодо цих двох питань:

  1. Якщо населення, яке вас цікавить, - це лише ті кандидати, яких ви спостерігали (наприклад, 100 кандидатів, які подали заявку в університет у 2016 році), вам не потрібно повідомляти про тести статистичної значимості. Це тому, що ваше зацікавлене населення було повністю вибірковане ... все, що вам цікаво, - це 100 кандидатів, про яких ви маєте повні дані. Тобто 60% є, повна зупинка, відрізняється від 40%. Питання, на яке є відповідь, чи існували гендерні відмінності серед 100 населення, яке подало заявку на програму? Це описове запитання, і відповідь - так.

  2. Однак багато важливих питань стосуються того, що відбуватиметься в різних умовах. Тобто багато дослідників хочуть придумати тенденції щодо минулого, які допомагають нам передбачити (а потім планувати) майбутнє. Прикладним питанням у цьому плані було б: Наскільки ймовірно, що майбутні тести кандидатів можуть відрізнятися за гендерною ознакою? Населення, яке представляє інтерес, тоді ширше, ніж у сценарії №1 вище. На даний момент важливим питанням є: чи можуть ваші спостережувані дані бути репрезентативними для майбутніх тенденцій? Це інфекційне запитання, і на основі інформації, наданої оригінальним плакатом, відповідь така: ми не знаємо.

Підсумовуючи, яка статистика, яку ви повідомляєте, залежить від типу запитання, на яке ви хочете відповісти.

Думка про базовий проект дослідження може бути найбільш корисною (спробуйте тут: http://www.socialresearchmethods.net/kb/design.php ). Думка про надселення може бути корисною, якщо ви хочете отримати більш розширену інформацію (ось стаття, яка може допомогти: http://projecteuclid.org/euclid.ss/1023798999#ui-tabs-1 ).


2

Якщо ви вважаєте, що ви вимірюєте як випадковий процес, то так статистичні тести є актуальними. Візьмемо для прикладу, перегортаючи монету 10 разів, щоб побачити, чи справедлива вона. У вас виходить 6 голів і 4 хвости - що ви робите висновок?


1
Я не дуже розумію, як висновок, який ви дійшли з питання про підкидання монети, пов'язаний із заданим питанням. Можливо, ви могли трохи розширитись із цього приводу? Статистичні тести здаються релевантними настільки, наскільки вони допомагають отримувати спостережувані результати для більшої сукупності, чи то референтна чи загальна. Питання тут виглядає так: враховуючи, що вибірка близька до сукупності учасників тестування протягом певного періоду часу (тут один рік), чи є класичним висновком правильний спосіб прийняти рішення про можливі відмінності на індивідуальному рівні?
chl

1
@chl Так, але, схоже, ОП намагається зробити основу ймовірності успіху. Тести порівнюють спостережувані пропорції з теоретичним розподілом, щоб визначити, чи є різниця для заданого рівня впевненості. Ви перевіряєте будь-яку форму випадковості, а не лише випадковість помилок вибірки.
Джеймс
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.