Чи чарівне число 20?


12

У мене є посилання, які радили враховувати розмір вибірки мінімум 20 для розподілу відповідних даних.

Чи є в цьому сенс?

Дякую


3
Взагалі ні, можливо в конкретних ситуаціях. Чи є у вас посилання та які ваші цілі?
image_doctor

1
Я погоджуюся з @image_doctor - немає загальної причини, чому 20 спостережень слід розглядати як мінімум; це може статися в дуже конкретних обставинах.
Glen_b -Встановити Моніку

3
Одна величини буде працювати в деяких практичних випадках, наприклад, коли розподіл відомо (з упевненістю) , щоб бути Пуассон і спостереження є великим графом. Це не тільки дозволяє розподіл бути відповідним, але також дозволяє оцінити ймовірні помилки в оцінці його параметра.
whuber

1
Я вважаю, що я також читав, що для звичайних розподілів 30 - це правило. Мені здається, це було щось пов’язане з тим, наскільки нормальне співвідношення t студента з 30 градусами свободи. Але це просто велике правило. Це не магія в тому ж сенсі, що значення . e
Уейн

1
Так, 20 - це магічне число: en.wikipedia.org/wiki/Magic_number_%28physics%29
побіжно

Відповіді:


13

Стільки цього залежить від очікуваного розподілу та того, яке ваше дослідницьке питання. Як правило, ви повинні насторожено ставитися до правил великого пальця. Якщо ви знаєте очікуваний розподіл, запустіть кілька моделей різного розміру та визначте, як часто вибіркові імітації відображають фактичний розподіл. Це повинно дати вам деякі рекомендації як кінцевий необхідний розмір вибірки.


+1 для керування чіткими і догматичними твердженнями.
whuber

1
Частково +1 через "Як правило, ви повинні насторожено ставитися до правил".
Вольфганг

7

Я подумав, що магічне число вибірки - 1000. Ось що має більшість національних опитувань США, щоб призвести до помилки приблизно 3%: Насправді ефективні розміри вибірки нижчі ніж 1000, більше як 700 або більше, через неоднакову ймовірність вибору та коригування невідповіді, що призводить до похибки 3,7% .

z0.9750.50.5/1000=1.960.158=0.031

|skewness|n2n1=4.58,|kurtosis|n23n+3n1=18.05.

n=20

h=1.06σ^n1/5=0.58σ^

ms(s/m)(3+(s/m)2)202
whuber

1
Обов’язкове посилання на "Синдром потужності десяти" в контексті використання 1000 як розмір вибірки (в контексті статистики, пов'язаної з програмуванням, але вона застосовується в іншому місці): zedshaw.com/essays/programmer_stats.html
Gary S. Вівер

1
@whuber, ти занадто розумний, без образи. Більшість людей обчислюють косисть як момент даних, а не через параметричне припущення, як ви щойно робили. Тепер, якби я сказав: "Припустимо, ви підходите до розподілу Пірсона методом моментів" - чи був би цей аргумент доречним?
StasK

Так, це було б актуально у багатьох випадках. Я дотримувався вашої пропозиції підходити до лонормального розподілу, використовуючи метод моментів, і отримував велику косисть - не дивно. Це тому, що я відповідав лише перші два моменти, дозволяючи третьому бути тим, що може бути. Якби я дотримувався тієї самої процедури з будь-яким сімейством розподілу з двома або меншими параметрами, що дозволяє довільно великі треті моменти, я думаю, я би побачив те саме явище. З сім’єю Пірсонів, яка має більше двох параметрів, ми, швидше за все, намагатимемося співставити емпіричну спотвореність, тим самим обмеживши її значення.
whuber

2

Ні. Не віддалено.

Подумайте про це так: якби у вас був мільярдний простір (людство) і ви витягли 20 зразків будь-яким методом (20 людей), ви могли б використовувати інформацію, отриману ними, щоб зрозуміти, що добре кожна людина на планеті? Не віддалено. У галактиці Чумацький Шлях знаходиться 100 мільярдів зірок. Вибравши (випадковим чином) 20 з них, ви можете зрозуміти всю галактичну астрономію? У жодному разі.

У 1-денному просторі є деякі евристики, в основному діючі правила, які можуть допомогти, які описують, скільки вимірювань ви хочете зробити. Вони включають різну ступінь корисності та обгрунтування, але в деякому сенсі є більш захищеними, ніж "20". Вони включають "5 вимірювань на змінну у вашому рівнянні придатності", "щонайменше 35 зразків функції гауссової щільності" та "принаймні 300 зразків біноміальної функції". Справжні статистики, а не ботанік, як я, зможуть пов'язувати конкретні інтервали довіри та невизначеності з перших принципів і без калькулятора.

a3r3+a2r2+a1r+a0a1r+a0dr

Будь ласка, пам’ятайте, що «найкраще» - це безглузда ідея, не маючи «міри доброти». Який найкращий шлях? Якщо ви збираєтеся до своєї приреченості, можливо, надзвичайно довгу і приємну. Якщо ви збираєтеся на власну коронацію, можливо, коротку та розкішну. Якщо ви гуляєте по пустелі, прохолодний тінистий. Яка «найкраща» кількість зразків? Він настільки приголомшливо залежить від вашої проблеми, що на неї не можна почати відповідати авторитетно. Усі? Скільки ви можете? Ті лише мають трохи сенсу. Так, це як бути частково мертвим або вагітним. Бути частково безглуздим є наслідком дуже недостатньо визначеної проблеми.

Якщо ви намагаєтеся точно прогнозувати потік повітря через літак? Можливо, вам знадобиться кілька мільйонів вимірювань, щоб потрапити в парк-бал. Якщо ви хочете знати, наскільки ви високі, один або два можуть зробити цю роботу.

Це не спричиняє важливих моментів "простягання простору" та "вибірки в місцях, що мінімізують розбіжність в оцінках параметрів", але питання, яке запропонувало більш відповідь на рівні першокурсника, було б актуальним. Ці речі потребують більш детального знання про природу проблеми, перш ніж вони можуть бути реалізовані.

Примітка: відредаговано для вдосконалення пропозицій.


1
Ви, здається, прочитали "мінімум" у питанні як "максимум" або "достатній". Ніщо, що ви написали, не суперечить правилу мінімум-20.
whuber

2
@whuber, я працюю серед людей, які вважають, що додаткові вимірювання дорогі, і якщо я надаю їм "мінімальну кількість проб", вони не вважають це нерівністю, де потенційна кількість зразків більша за це. Вони розглядають це як межу для проблеми оптимізації мінімізації витрат і намагаються діяти лише з цією цінністю. Це продукт мого оточення.
EngrStudent

1

Можливо, для контексту, в якому ви проводите t-тести, або ANOVAR - досить поширений контекст у базових статистичних програмах, - це приблизно розмір вибірки, який вам потрібен для кожної групи, щоб мати змогу мати велику впевненість у тому, що середня група може бути приблизно зазвичай розподіляється (згідно з центральною граничною теоремою), коли розподіл можна вважати більш-менш одномодальним та не надзвичайно піковим. Двадцять і не дев'ятнадцять чи двадцять один, тому що це кругле число.


0

Перегляньте сторінку "Енергія та розмір вибірки" Русса Лента для деяких статей на цю тему (у розділі "Порада" в середині сторінки).

Мінімальна кількість осіб у вашій вибірці різко змінюється залежно від розміру сукупності, кількості розмірів (якщо ви ділите дані за категоріями) та заходів (якщо ви вживаєте постійних заходів щодо індивідів вибірки), які ви вживаєте, розміру ваш Всесвіт, техніка аналізу, яку ви маєте намір використовувати (це дуже важливий момент - техніка визначається під час планування дослідження або під час експериментального проектування , після цього) та складність, показана попередніми дослідженнями.

І 20 недостатньо для будь-яких серйозних досліджень поза предметами "рідкісних захворювань" та "експериментальної психології" (психіка, як визначив Поппер у своїй роботі).

Уточнення відповіді на основі коментарів нижче:

І 20 недостатньо для будь-яких серйозних досліджень поза предметами "рідкісних захворювань" та "експериментальної психології" (психіка, як визначив Поппер у своїй роботі), що передбачає пристосування розподілу ймовірностей .

І ні, вам не слід тримати отруєння людей, щоб досягти великого розміру вибірки. Загальноприйняті та послідовні тести наказують вам зупинитися.


3
Я вважаю, що це занадто екстремально, щоб дати обґрунтовану заяву, що вибірки 20 "недостатньо для будь-яких серйозних досліджень". Це суперечить вашим попереднім твердженням про те, що відповідний розмір вибірки змінюється залежно від призначення, кількості населення тощо. У деяких випадках одного фальсифікаційного результату достатньо, щоб знищити цілу теорію.
whuber

1
Приклади та якісні дослідження можуть справитись із 1-5 учасниками.
Behacad

Гаразд, додайте до списку "тематичні дослідження" та "фокус-групи" :) Вони включені в те, що я сказав, Поппер назвав "експериментальною психологією" тхо.
Лукас Галліндо

4
Тоді вам краще додати астрономію, медицину, біологію, хімію, ... Іншими словами, так само погано стверджувати, що 20 "недостатньо", як і стверджувати, що це досить добре. Власне, це, мабуть, і гірше. Уявіть випробування щодо безпечності харчових продуктів, в якому перші вісім суб'єктів, яким вводили харчові добавки, померли від непередбачених побічних ефектів. Чи рекомендуєте ви продовжувати тестування на основі заяви "20 недостатньо"?
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.