Приклад розподілу, коли для теореми центральної межі необхідний великий розмір вибірки


19

У деяких книгах зазначено, що розмір вибірки розміром 30 або вище необхідний, щоб теорема про центральну межу дала хороший наближення для . X¯

Я знаю, цього недостатньо для всіх дистрибутивів.

Я хотів би побачити кілька прикладів розподілів, де навіть при великому розмірі вибірки (можливо, 100, 1000 або більше) розподіл середнього зразка все ще досить перекошений.

Я знаю, що раніше бачив подібні приклади, але не можу пригадати, де і не можу їх знайти.


5
Розглянемо розподіл гамми з параметром форми . Візьміть шкалу як 1 (не має значення). Припустимо, ви вважаєте , як тільки «досить нормальне». Тоді розподіл, для якого потрібно отримати 1000 спостережень, щоб бути достатньо нормальним, має розподіл . Гамма ( α 0 , 1 )αGamma(α0,1)Gamma(α0/1000,1)
Glen_b -Встановіть Моніку

1
@Glen_b, чому б не зробити цю офіційну відповідь і трохи не розробити її?
gung - Відновіть Моніку

4
Будь-яке достатньо забруднене розповсюдження буде працювати, відповідно до прикладу @ Glen_b. Наприклад , коли основний розподіл являє собою суміш нормальної (0,1) і нормальної (величезна величина, 1), при цьому останні мають лише невелику ймовірність появи, то цікаві речі трапляються: (1) більшість часу , забруднення не з’являються і немає доказів перекосу; але (2) іноді з'являється забруднення, а перекос у зразку величезний. Розподіл середнього зразка буде сильно перекошеним незалежно, але завантажувальне завантаження ( наприклад ) зазвичай не виявить його.
whuber

1
Приклад @ whuber є повчальним, показуючи, що теорема про центральну межу теоретично може бути довільно оманливою. У практичних експериментах, я думаю, потрібно запитати себе, чи може бути якийсь величезний ефект, який виникає дуже рідко, і застосовувати теоретичний результат з невеликою обробкою.
Девід Епштейн

Відповіді:


19

У деяких книгах зазначено, що розмір вибірки розміром 30 або вище необхідний, щоб теорема про центральну межу дала хороший наближення для .X¯

Це поширене правило великого значення є абсолютно марним. Є ненормальні розподіли, для яких n = 2 буде нормальним, а ненормальні розподіли, для яких значно більший недостатній - тому без явного обмеження обставин правило вводить в оману. У будь-якому випадку, навіть якби це було правдою, потрібні змінюватимуться залежно від того, що ви робите. Часто ви отримуєте хороші наближення поблизу центру розподілу при малих , але потрібні набагато більші щоб отримати гідне наближення в хвіст.n n nnnnn

Редагувати: Дивіться відповіді на це запитання для численних, але, очевидно, одностайних думок з цього питання, а також декількох хороших посилань. Я не буду справляти справу, оскільки ви це вже чітко розумієте.

Я хочу побачити декілька прикладів розподілів, де навіть при великому розмірі вибірки (можливо, 100 або 1000 або вище) розподіл середнього зразка все ще досить перекошений.

Приклади можна легко побудувати; один простий спосіб - знайти нескінченно подільний розподіл, який є не нормальним, і розділити його. Якщо у вас є той, який наблизиться до нормального, коли ви будете в середньому або підсумувати його, починайте на межі "близького до нормального" і розділіть його на скільки завгодно. Так, наприклад:

Розглянемо розподіл Гамма з параметром форми . Візьміть шкалу як 1 (шкала не має значення). Скажімо, ви вважаєте просто "досить нормальним". Тоді розподіл, для якого потрібно отримати 1000 спостережень, щоб бути достатньо нормальним, має розподіл . Гамма ( α 0 , 1 ) Gamma ( α 0 / 1000 , 1 )αGamma(α0,1)Gamma(α0/1000,1)

Тож якщо ви відчуваєте, що гамма з просто 'нормальна' -α=20

Гамма (20) pdf

Потім розділіть на 1000, щоб отримати :α = 0,02α=20α=0.02

Гамма (0,02) pdf

В середньому 1000 з них матимуть форму першого PDF (але не його масштаб).

Якщо ви замість цього обрали нескінченно подільний розподіл, який не наближається до нормального, як, наприклад, Коші, то може не бути розміру вибірки, при якому засоби вибірки мають приблизно нормальні розподіли (або, в деяких випадках, вони все ще можуть наближатися до нормальності, але у вас немає ефекту для стандартної помилки).σ/n

@ думка Уубера щодо забруднених розподілів дуже хороша; можливо, варто спробувати трохи моделювання з цим випадком і побачити, як поводяться справи в багатьох подібних зразках.


12

Окрім безлічі чудових відповідей, наданих тут, Ренд Вілкокс опублікував чудові статті з цього питання і показав, що наша типова перевірка адекватності нормального наближення є досить оманливою (і недооцінює необхідний розмір вибірки). Він відзначає, що середнє може бути приблизно нормальним, але це лише половина історії, коли ми не знаємо . Коли невідома, ми зазвичай використовуємо розподіл для тестів та меж довіри. Дисперсія вибірки може бути дуже-дуже далекою від масштабованого і отримане співвідношення може виглядати не так, як розподіл колиσ t χ 2 t t n = 30 s 2 ˉ Xσσtχ2ttn=30. Простіше кажучи, ненормальність псує більше, ніж вона псує .s2X¯


2
Це хороший момент; це насправді не означає, що люди мають справу, а певну функцію цього та інші речі. Однак це не лише що можна зіпсувати, ви також втрачаєте незалежність чисельника та знаменника, і це може мати деякі дивовижні ефекти в хвостах. s2
Glen_b -Встановити Моніку

9

Цей документ може бути корисним (або принаймні цікавим):

http://www.umass.edu/remp/Papers/Smith&Wells_NERA06.pdf

Дослідники з UMass насправді провели дослідження, подібне до того, що ви запитуєте. При якому розмірі вибірки певні розподілені дані слідують за нормальним розподілом завдяки CLT? Очевидно, що багато даних, зібраних для експериментів з психології, не є десь поблизу нормально розповсюджених, тому дисципліна досить сильно покладається на CLT, щоб робити будь-які висновки щодо їх статистики.

Спочатку вони провели тести на дані, які були рівномірними, бімодальними та однією дистибуцією, яка була нормальною. Використовуючи Колмогорова-Смірнова, дослідники перевірили, скільки розподілів було відхилено для нормальності на рівні .α=0.05

Table 2. Percentage of replications that departed normality based on the KS-test. 
 Sample Size 
           5   10   15   20   25  30 
Normal   100   95   70   65   60  35 
Uniform  100  100  100  100  100  95 
Bimodal  100  100  100   75   85  50

Як не дивно, 65 відсотків зазвичай розповсюджених даних було відхилено з розміром вибірки 20, і навіть з розміром вибірки 30, 35% все ж були відхилені.

Потім вони протестували кілька декількох сильно перекошених розподілів, створених за допомогою енергетичного методу Флейшмана:

Y=aX+bX2+cX3+dX4

X являє собою значення, отримане з нормального розподілу, тоді як a, b, c і d є константами (зауважимо, що a = -c).

Вони провели тести з розмірами зразків до 300

Skew  Kurt   A      B      C       D 
1.75  3.75  -0.399  0.930  0.399  -0.036 
1.50  3.75  -0.221  0.866  0.221   0.027 
1.25  3.75  -0.161  0.819  0.161   0.049 
1.00  3.75  -0.119  0.789  0.119   0.062 

Вони виявили, що при найвищих рівнях перекосу та курта (1,75 та 3,75) розміри зразків 300 не дають зразків засобів, які супроводжуються нормальним розподілом.

На жаль, я не думаю, що це саме те, що ви шукаєте, але я натрапив на це і вважаю це цікавим, і думав, що ви теж можете.


4
" Як не дивно, 65 відсотків зазвичай розповсюджених даних було відхилено з розміром вибірки 20, і навіть з розміром вибірки 30, 35% все ще були відхилені. " - тоді це здається, що вони неправильно використовують тест; як тест на нормальність для повністю визначених нормальних даних (для чого тест), якщо вони правильно використовують, він повинен бути точним .
Glen_b -Встановіть Моніку

5
@Glen_b: Тут є кілька джерел потенційної помилки. Якщо ви читаєте документ, ви зауважите, що те, що тут вказано як "нормальне", - це насправді звичайні випадкові величини із середнім значенням 50 та стандартним відхиленням 10, округленими до найближчого цілого числа . Отже, у цьому сенсі використовуваний тест вже використовує неправильно розподілений розподіл. По-друге, все ж здається, що вони виконали тести неправильно, оскільки мої спроби реплікації показують, що для вибірки мають на увазі 20 таких спостережень, ймовірність відхилення становить приблизно 27%. (продовження)
кардинал

5
(продовження) Третє, незалежно від вищезазначеного, деяке програмне забезпечення може використовувати асимптотичний розподіл, а не фактичний, хоча при розмірах вибірки 10K це не повинно мати великого значення (якщо зв'язки не були штучно індуковані на даних). Нарешті, ми знаходимо таке досить дивне твердження наприкінці цього документа: На жаль, властивості KS-тесту в S-PLUS обмежують роботу. Р-значення для цього дослідження були складені вручну за допомогою декількох реплікацій. Потрібна програма для обчислення р-значень та винесення судження про них порівняно з обраним рівнем альфа.
кардинал

3
Привіт @Glen_b. Я не вірю, що округлення зменшить швидкість відхилення тут, тому що я вважаю, що вони перевіряли справжній стандартний нормальний розподіл, використовуючи округлені дані (що я мав на увазі під тестом, використовуючи неправильно розподілений розподіл). (Можливо, ви, натомість, думали використовувати тест KS на дискретному розподілі.) Розмір вибірки для тесту KS становив 10000, а не 20; вони зробили 20 повторень у розмірі вибірки 10000 кожна, щоб отримати таблицю. Принаймні, це було моє розуміння опису від зневоднення документа.
кардинал

3
@cardinal - ви, звичайно, неправі, тому, можливо, це може стати джерелом суттєвих фрагментів відхилень при великих розмірах вибірки. Re: " Розмір вибірки для тесту на KS становив 10000, а не 20 " ... добре, це звучить все дивно. Залишається дивуватися, чому вони вважають, що будь-яка з цих умов має велику цінність, а не говорити навпаки.
Glen_b -Встановіть Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.