Чому кілька (якщо не всі) параметричних тестів на гіпотезу припускають випадкову вибірку?


12

Тести, такі як Z, t та кілька інших, припускають, що дані базуються на випадковій вибірці. Чому?

Припустимо, я роблю експериментальні дослідження, де я дбаю набагато більше про внутрішню обгрунтованість, ніж про зовнішню. Отже, якщо мій зразок може бути трохи упередженим, добре, як я прийняв не виводити гіпотезу для цілих груп населення. І групування все одно буде випадковим, тобто я виберу для зручності учасників вибірки, але випадково віднесу їх до різних груп.

Чому я не можу просто проігнорувати це припущення?


Якщо техніка вибірки вводить зміщення, то це не є "випадковим". Якщо він не вводить ніяких упереджень, то він є "випадковим" (для деякого визначення випадкового ;-). У мене були схеми відбору зразків, які просто брали кожен 7-й зразок, щоб створити відповідні розміри вибірки до лічильника. Однак я знав, що в цьому відборі немає особливого аспекту, тому те, що можна розглядати як невипадковий процес вибірки, все ще фактично було випадковим. Це те саме, що підбирати кульки 1,2,3,4,5,6 на лотерею. Це так само випадково, як і будь-яка інша послідовність.
Філіп Оуклі,

1
@PhilipOakley: вибір кульок 1,2,3,4,5,6 на лотереї дає вам такий же шанс виграти, як і будь-який інший відбір, але зменшує очікуваний виграш, оскільки вам, швидше за все, доведеться ділитися призом з іншими, хто була така ж ідея
Генрі

1
Систематичну вибірку, таку як описав @Philip, часто аналізують так, ніби вона дала прості випадкові вибірки, але вона має підводні камені. Наприклад, якщо ви щодня вимірювали виробничий процес і проводили вибірку кожного сьомого вимірювання, ви б зазнали плутанини результатів із ефектом дня тижня, оскільки (очевидно) ви б взяли вибірку в той же день щотижня. Вам потрібно більше працювати, щоб придумати та вирішити такі тонкощі під час роботи з невипадковими зразками.
whuber

1
@whuber, абсолютно. Треба важко (і широко) думати про ці речі !! У моєму випадку я мав години відео, із сотнями подій, з великими проміжками між ними, так що потрібно зменшити розмір даних без набору подій для простої логістичної регресії (кожен кадр розглядається незалежно, невелика зміна між кадрами), так випадання безлічі кадрів без подій було розумним. Аспект часової послідовності розглядався окремо.
Філіп Оуклі

1
@Philip Цікаво, що майже в той же час, коли ви писали, що коментар про випадковість не існує, NIST оприлюднив прес-реліз, у якому стверджував, що це є . Обліковий запис з’являється у сьогоднішньому (4 квітня 2018 року) випуску Nature .
whuber

Відповіді:


18

Якщо ви не робите жодного висновку для ширшої групи, ніж ваша фактична вибірка, то в першу чергу не застосовується статистичні тести, і питання про «упередженість» не виникає. У цьому випадку ви просто обчислите описову статистику вашого зразка, які відомі. Так само в цьому випадку не виникає питання щодо "дійсності" моделі - ви просто спостерігаєте за змінними і записуєте їх значення та описи аспектів цих значень.

Після того, як ви вирішите вийти за рамки вашої вибірки, зробити висновки про якусь більшу групу, тоді вам знадобиться статистика, і вам потрібно буде розглянути такі питання, як зміщення вибірки тощо. У цій програмі випадкова вибірка стає корисною властивістю для отримання надійності умовиводи більш широкої групи інтересів. Якщо у вас немає випадкової вибірки (і ви не знаєте ймовірностей ваших зразків на основі сукупності), то зробити важкі / неможливо зробити достовірні умовиводи щодо популяції.


5

У реальному науковому дослідженні досить рідко є дані, які надійшли від справжньої випадкової вибірки. Дані майже завжди є зразками зручності. Це в першу чергу впливає на те, яку кількість населення ви можете узагальнити. Однак, навіть якщо вони були зразком зручності, вони дійшли звідкись, вам просто потрібно зрозуміти, де і які обмеження випливає. Якщо ви дійсно вважаєте, що ваші дані не є репрезентативними для будь-якого, то ваше дослідження не буде корисним на будь-якому рівні, але це, мабуть, не відповідає дійсності 1 . Таким чином, часто розумно вважати ваші зразки взяті звідкись і використовувати ці стандартні тести, принаймні, в захищеному або кваліфікованому сенсі.

Однак існує інша філософія тестування, яка стверджує, що нам слід відходити від тих припущень і тестів, які покладаються на них. Тукі був прихильником цього. Натомість більшість експериментальних досліджень вважається (внутрішньо) достовірним, оскільки досліджувані одиниці (наприклад, пацієнти) були випадковим чином віднесені до зброї. Враховуючи це, ви можете використовувати тести перестановки , які здебільшого лише припускають, що рандомізація була виконана правильно. Контраргументом надто хвилюватися з цього приводу є те, що тести на перестановку, як правило, показують те саме, що і відповідні класичні тести, і їх потрібно виконати більше. Отже, стандартні тести можуть бути прийнятними.

1. Докладніше в цьому напрямку може допомогти прочитати мою відповідь тут: Визначення сукупності та зразків у дослідженні .


3

Випробування на зразок Z, t та декількох інших ґрунтуються на відомих розподілах вибірки відповідної статистики. Ці розподіли вибірки, як правило, використовуються для визначення статистики, обчисленої з випадкової вибірки.

Іноді можливо можливо розробити відповідний розподіл вибірки для невипадкового відбору проб, але в цілому це, мабуть, неможливо.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.