Передумови: я викладаю колегам, які працюють на тестуванні гіпотез, і розумію більшу частину цього чудово, але є один аспект, який я зав’язую у вузли, намагаючись зрозуміти, а також пояснюю іншим.
Це я думаю, що знаю (будь ласка, виправте, якщо не так!)
- Статистика, яка була б нормальною, якби відома дисперсія, слідкуйте за -розподілом, якщо дисперсія невідома
- CLT (центральна гранична теорема): розподіл вибірки середнього зразка приблизно нормальний для досить великих (може бути , може бути до для сильно перекошених розподілів)30 300
- -розподіл можна вважати нормальним для ступенів свободи> 30
Ви використовуєте -test, якщо:
- Норма популяції та відома дисперсія (для будь-якого розміру вибірки)
- Населення нормальне, дисперсія невідома і (завдяки CLT)
- Населення двочленове, ,n q > 10
Ви використовуєте -test, якщо:
- Населення нормальне, дисперсія невідома і
- Немає знань про популяцію чи дисперсію та , але вибіркові дані виглядають нормально / проходять тести тощо, тому популяція може вважатися нормальною
Тож мені залишається:
- Для зразків та (?) Відсутні відомості про популяцію та дисперсію, відомі / невідомі.< ≈ 300
Тому мої запитання:
При якому розмірі вибірки ви можете припустити (де немає відомостей про розподіл чи дисперсію популяції), що розподіл вибірки середнього значення є нормальним (тобто CLT почав), коли розподіл вибірки виглядає ненормальним? Я знаю, що для деяких дистрибутивів потрібно , але, здається, деякі ресурси використовують -test кожного разу, коли ...z n > 30
Для випадків, в яких я не впевнений, я припускаю, що я переглядаю дані для нормальності. Тепер, якщо дані вибірки виглядають нормально, чи використовую я -test (оскільки вважаю популяцію нормальною, а з )?n > 30
А як там, де вибіркові дані для випадків, щодо яких я не впевнений, не виглядають нормально? Чи є обставини, коли ви все-таки використовуєте -test або -test або завжди шукаєте трансформувати / використовувати непараметричні тести? Я знаю, що завдяки CLT, при деякому значенні розподіл вибірки середнього значення буде приблизним до нормального, але вибіркові дані не скажуть мені, яке це значення ; дані вибірки можуть бути ненормальними, тоді як середнє значення вибірки дорівнює нормі / . Чи бувають випадки, коли ви б трансформували / використовували непараметричний тест, коли насправді розподіл вибірки середнього значення був нормальним / але ви не могли сказати? z n n t t