Які посилання слід наводити для підтримки, використовуючи 30 як достатньо великий розмір вибірки?


41

Я багато разів читав / чув, що розмір вибірки принаймні 30 одиниць вважається "великим зразком" (припущення щодо нормальності засобів зазвичай приблизно дотримуються завдяки CLT, ...). Тому в своїх експериментах я зазвичай генерую зразки 30 одиниць. Чи можете ви, будь ласка, дати мені якусь посилання, яку слід навести при використанні зразка 30?


2
Без посилання на кількість параметрів, які ви намагаєтеся оцінити, або рівнозначно типу моделі, з якою працюєте, здається вам досить складно дати чітку відповідь.
chl

2
Прийняття n = 30 як кордону малих та великих вибірок недостатньо підтримується жодною статистичною технікою.
Джибол

Відповіді:


37

Вибір n = 30 для межі між малими та великими зразками - це лише правило. Існує велика кількість книг, які цитують (навколо) цю цінність, наприклад, " Ймовірність та статистичні умовислідування Гогга та Таніса" (7е) говорять про "більше 25 або 30".

Тим не менше , історія , розказана мені в тому , що єдина причина , по 30 була розцінена як хороша межа тому , що він зробив для гарненького Стьюдента т таблиць в задній частині підручників добре поміщаються на одній сторінці. Це, і критичні значення (між t і нормальним Стьюдента ) відключаються лише приблизно до 0,25, у будь-якому випадку, від df = 30 до df = нескінченності. Для обчислення рук різниця насправді не мала значення.

Сьогодні легко обчислити критичні значення для всіляких речей до 15 знаків після коми. Крім того, у нас є методи перестановки та перестановки, для яких ми навіть не обмежені лише параметричними розподілами населення.

На практиці я ніколи не покладаюся на n = 30. Наведіть дані. Накладіть звичайний розподіл, якщо вам подобається. Візуально оцініть, чи підходить нормальне наближення (і запитайте, чи потрібне наближення навіть насправді). Якщо генерування зразків для дослідження та наближення є обов'язковим, генеруйте достатній розмір вибірки, щоб зробити наближення максимально близьким (або максимально близьким до обчислень).


13
Ось сторінка про те, наскільки точно нормальне наближення розподілу t дорівнює n = 30. johndcook.com/normal_approx_to_t.html
Джон Д. Кук

41

Власне, "магічне число" 30 - це помилка. Дивіться чудовий документ Якова Коена, « Що я навчився (поки що)» (Am. Psych. Грудень 1990 р. 45 № 12, стор 1304-1312) . Цей міф - його перший приклад того, як "деякі речі, які ти дізнаєшся, не такі".

[О] не з моїх кандидатів-докторантів здобув дисертацію [із] вибіркою лише 20 випадків на групу. ... [L] ater я виявив ... що для середнього порівняння з двома незалежними групами з на групу на освяченому двоступеневому рівні , ймовірність того, що ефект середнього розміру буде позначений в знаменний ... т тест був тільки . Таким чином, приблизно монети перевернули, чи вдасться отримати вагомий результат, хоча насправді розмір ефекту мав значення. ... [Мій друг] закінчився несуттєвими результатами - з якими він приступив до знесення важливої ​​галузі психоаналітичної теорії.n=30.05.47.47


2
Прекрасна довідка - і відповідне місце. Дякую.
whuber

1
@whuber Ви пам’ятаєте, про який папір це було? Посилання перервано на даний момент. Можливо, це psych.colorado.edu/~willcutt/pdfs/Cohen_1990.pdf , "Що я навчився (поки що)"? Рік відповідає одному в URL-адресі розірваного посилання.
амеба каже, що відбудеться Моніка

1
@Amoeba Я врятував цей документ, коли прочитав його, тому я можу підтвердити те, що ви знайшли - це призначене. Я оновив цю відповідь, щоб включити цитування разом із вашим посиланням.
whuber

@Carlos Accioly Я оновив це нове посилання, оскільки попереднє було порушено.
Акшай Бансал

9

IMO, все залежить від того, для чого ви хочете використовувати ваш зразок. Два "нерозумні" приклади, щоб проілюструвати, що я маю на увазі: Якщо вам потрібно оцінити середнє значення, 30 спостережень більш ніж достатньо. Якщо вам потрібно буде оцінити лінійну регресію зі 100 провісниками, 30 спостережень буде недостатньо близьким.


9

μ¯(n)

Загалом, CLT, по суті, потребує двох опор:

  1. Що випадкові змінні незалежні: ви можете переупорядкувати свої спостереження, не втрачаючи жодної інформації *.
  2. Що rv походить від розподілу з кінцевими другими моментами: це означає, що класичні оцінки середнього та sd мають тенденцію до зближення у міру збільшення розміру вибірки.

(Обидва ці умови можуть бути дещо ослабленими, але відмінності в основному мають теоретичний характер)


6
Ваш приклад ілюструє значення надійної статистики. Середня вибірка оцінює параметр розташування свердловини розподілу Коші. Можна стверджувати, що найслабшою ланкою використання t-тесту з 30 зразками є t-тест, а не 30 зразків.
Джон Д. Кук

1
Джон:> "Можна стверджувати, що найслабшою ланкою використання t-тесту з 30 зразками є t-тест, а не 30 зразків". Дуже вірно, а також припущення, що дані є ідентичними . Також медіаною є MLE для розподілених випадкових змінних Коші (і, отже, ефективних) Коші, але загалом вам може знадобитися більше 30 спостережень.
user603

1
Не всі версії CLT покладаються на ідентичний розподіл, а також на незалежність. Основні з них, які викладають для підпільників, часто є, але є версії, які не дають обох припущень, наприклад, CLT Ляпунова передбачає незалежність, але не є ідентичними розподілами, і умову незалежності також можна послабити, наприклад, дивіться тут . Це "переупорядкування" також не є незалежністю. Деякі форми залежності не покладаються на порядок.
Glen_b

2
Розмір вибірки 50 000 недостатній для того, щоб CLT працював достатньо добре для обчислення довірчого інтервалу для середнього значення нормального розподілу журналу.
Френк Харрелл
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.