У мене є посилання, які радили враховувати розмір вибірки мінімум 20 для розподілу відповідних даних.
Чи є в цьому сенс?
Дякую
У мене є посилання, які радили враховувати розмір вибірки мінімум 20 для розподілу відповідних даних.
Чи є в цьому сенс?
Дякую
Відповіді:
Стільки цього залежить від очікуваного розподілу та того, яке ваше дослідницьке питання. Як правило, ви повинні насторожено ставитися до правил великого пальця. Якщо ви знаєте очікуваний розподіл, запустіть кілька моделей різного розміру та визначте, як часто вибіркові імітації відображають фактичний розподіл. Це повинно дати вам деякі рекомендації як кінцевий необхідний розмір вибірки.
Я подумав, що магічне число вибірки - 1000. Ось що має більшість національних опитувань США, щоб призвести до помилки приблизно 3%: Насправді ефективні розміри вибірки нижчі ніж 1000, більше як 700 або більше, через неоднакову ймовірність вибору та коригування невідповіді, що призводить до похибки 3,7% .
Ні. Не віддалено.
Подумайте про це так: якби у вас був мільярдний простір (людство) і ви витягли 20 зразків будь-яким методом (20 людей), ви могли б використовувати інформацію, отриману ними, щоб зрозуміти, що добре кожна людина на планеті? Не віддалено. У галактиці Чумацький Шлях знаходиться 100 мільярдів зірок. Вибравши (випадковим чином) 20 з них, ви можете зрозуміти всю галактичну астрономію? У жодному разі.
У 1-денному просторі є деякі евристики, в основному діючі правила, які можуть допомогти, які описують, скільки вимірювань ви хочете зробити. Вони включають різну ступінь корисності та обгрунтування, але в деякому сенсі є більш захищеними, ніж "20". Вони включають "5 вимірювань на змінну у вашому рівнянні придатності", "щонайменше 35 зразків функції гауссової щільності" та "принаймні 300 зразків біноміальної функції". Справжні статистики, а не ботанік, як я, зможуть пов'язувати конкретні інтервали довіри та невизначеності з перших принципів і без калькулятора.
Будь ласка, пам’ятайте, що «найкраще» - це безглузда ідея, не маючи «міри доброти». Який найкращий шлях? Якщо ви збираєтеся до своєї приреченості, можливо, надзвичайно довгу і приємну. Якщо ви збираєтеся на власну коронацію, можливо, коротку та розкішну. Якщо ви гуляєте по пустелі, прохолодний тінистий. Яка «найкраща» кількість зразків? Він настільки приголомшливо залежить від вашої проблеми, що на неї не можна почати відповідати авторитетно. Усі? Скільки ви можете? Ті лише мають трохи сенсу. Так, це як бути частково мертвим або вагітним. Бути частково безглуздим є наслідком дуже недостатньо визначеної проблеми.
Якщо ви намагаєтеся точно прогнозувати потік повітря через літак? Можливо, вам знадобиться кілька мільйонів вимірювань, щоб потрапити в парк-бал. Якщо ви хочете знати, наскільки ви високі, один або два можуть зробити цю роботу.
Це не спричиняє важливих моментів "простягання простору" та "вибірки в місцях, що мінімізують розбіжність в оцінках параметрів", але питання, яке запропонувало більш відповідь на рівні першокурсника, було б актуальним. Ці речі потребують більш детального знання про природу проблеми, перш ніж вони можуть бути реалізовані.
Примітка: відредаговано для вдосконалення пропозицій.
Можливо, для контексту, в якому ви проводите t-тести, або ANOVAR - досить поширений контекст у базових статистичних програмах, - це приблизно розмір вибірки, який вам потрібен для кожної групи, щоб мати змогу мати велику впевненість у тому, що середня група може бути приблизно зазвичай розподіляється (згідно з центральною граничною теоремою), коли розподіл можна вважати більш-менш одномодальним та не надзвичайно піковим. Двадцять і не дев'ятнадцять чи двадцять один, тому що це кругле число.
Перегляньте сторінку "Енергія та розмір вибірки" Русса Лента для деяких статей на цю тему (у розділі "Порада" в середині сторінки).
Мінімальна кількість осіб у вашій вибірці різко змінюється залежно від розміру сукупності, кількості розмірів (якщо ви ділите дані за категоріями) та заходів (якщо ви вживаєте постійних заходів щодо індивідів вибірки), які ви вживаєте, розміру ваш Всесвіт, техніка аналізу, яку ви маєте намір використовувати (це дуже важливий момент - техніка визначається під час планування дослідження або під час експериментального проектування , після цього) та складність, показана попередніми дослідженнями.
І 20 недостатньо для будь-яких серйозних досліджень поза предметами "рідкісних захворювань" та "експериментальної психології" (психіка, як визначив Поппер у своїй роботі).
І 20 недостатньо для будь-яких серйозних досліджень поза предметами "рідкісних захворювань" та "експериментальної психології" (психіка, як визначив Поппер у своїй роботі), що передбачає пристосування розподілу ймовірностей .
І ні, вам не слід тримати отруєння людей, щоб досягти великого розміру вибірки. Загальноприйняті та послідовні тести наказують вам зупинитися.