У деяких книгах зазначено, що розмір вибірки розміром 30 або вище необхідний, щоб теорема про центральну межу дала хороший наближення для .Х¯
Це поширене правило великого значення є абсолютно марним. Є ненормальні розподіли, для яких n = 2 буде нормальним, а ненормальні розподіли, для яких значно більший недостатній - тому без явного обмеження обставин правило вводить в оману. У будь-якому випадку, навіть якби це було правдою, потрібні змінюватимуться залежно від того, що ви робите. Часто ви отримуєте хороші наближення поблизу центру розподілу при малих , але потрібні набагато більші щоб отримати гідне наближення в хвіст.n n nнннн
Редагувати: Дивіться відповіді на це запитання для численних, але, очевидно, одностайних думок з цього питання, а також декількох хороших посилань. Я не буду справляти справу, оскільки ви це вже чітко розумієте.
Я хочу побачити декілька прикладів розподілів, де навіть при великому розмірі вибірки (можливо, 100 або 1000 або вище) розподіл середнього зразка все ще досить перекошений.
Приклади можна легко побудувати; один простий спосіб - знайти нескінченно подільний розподіл, який є не нормальним, і розділити його. Якщо у вас є той, який наблизиться до нормального, коли ви будете в середньому або підсумувати його, починайте на межі "близького до нормального" і розділіть його на скільки завгодно. Так, наприклад:
Розглянемо розподіл Гамма з параметром форми . Візьміть шкалу як 1 (шкала не має значення). Скажімо, ви вважаєте просто "досить нормальним". Тоді розподіл, для якого потрібно отримати 1000 спостережень, щоб бути достатньо нормальним, має розподіл . Гамма ( α 0 , 1 ) Gamma ( α 0 / 1000 , 1 )αГамма ( α0, 1 )Гамма ( α0/ 1000,1)
Тож якщо ви відчуваєте, що гамма з просто 'нормальна' -α = 20
Потім розділіть на 1000, щоб отримати :α = 0,02α = 20α = 0,02
В середньому 1000 з них матимуть форму першого PDF (але не його масштаб).
Якщо ви замість цього обрали нескінченно подільний розподіл, який не наближається до нормального, як, наприклад, Коші, то може не бути розміру вибірки, при якому засоби вибірки мають приблизно нормальні розподіли (або, в деяких випадках, вони все ще можуть наближатися до нормальності, але у вас немає ефекту для стандартної помилки).σ/ н--√
@ думка Уубера щодо забруднених розподілів дуже хороша; можливо, варто спробувати трохи моделювання з цим випадком і побачити, як поводяться справи в багатьох подібних зразках.