Що стосується t-випробування однієї вибірки, що відбувається, якщо в оцінці дисперсії середнє значення вибірки замінено на


10

Припустимо однопробний t-тест, де нульова гіпотеза . Тоді статистика t = ¯ x - μ 0μ=μ0 використанням стандартного відхилення вибіркиs. Оцінюючиs, можна порівняти спостереження із середньою вибіркою¯x:t=x¯μ0s/nssx¯

.s=1n1i=1n(xix¯)2

Однак, якщо вважати, що заданий є істинним, можна також оцінити стандартне відхилення s ∗, використовуючи μ 0 замість середнього зразка ¯ x :μ0sμ0x¯

.s=1n1i=1n(xiμ0)2

Для мене такий підхід виглядає більш природним, оскільки, отже, ми використовуємо нульову гіпотезу також для оцінки ПД. Хтось знає, чи отримана статистика використовується в тесті, чи знає, чому ні?


Я продовжую відповідати на це питання, тому що я збирався його опублікувати, і SE попередило мене. Мені було цікаво, чи є довідкові документи з цього питання. Інтуїтивно зрозуміло, , безумовно, буде кращою оцінкоюσ2, а розподіл ˉ x -μ0s2=1n(xiμ0)2σ2 може бути похідним (не студентом, імовірно). Будь-яка довідка буде оцінена! x¯μ0s/n
AG

Відповіді:


6

У цій посаді виникла проблема з оригінальним моделюванням, яке, сподіваємось, тепер виправлено.

Хоча оцінка стандартного відхилення вибірки, як правило, зростає разом із чисельником, оскільки середнє значення відхиляється від , виявляється, це не має такого великого впливу на потужність при "типових" рівнях значущості, тому що в середніх до великих зразках, s / μ0 все ще має тенденцію бути достатньо великим для відхилення. У менших зразках це може мати певний ефект, але при дуже малих рівнях значущості це може стати дуже важливим, оскільки це поставить верхню межу потужності, яка буде меншою за 1.s/n

x¯μ

Це означає, що тест більше не має розподілу t під нулем. Це не фатальна вада, але це означає, що ви не можете просто використовувати таблиці та отримати потрібний рівень значущості (як ми побачимо через хвилину). Тобто тест стає консервативним, і це впливає на потужність.

Коли n стає великим, ця залежність стає меншою проблемою (не в останню чергу тому, що ви можете викликати CLT для чисельника і використовувати теорему Слуцького, щоб сказати, ніж існує асимптотичний нормальний розподіл для модифікованої статистики).

μ0sn=10

n = 10

введіть тут опис зображення

Ви можете бачити, що крива потужності нижча (вона стає набагато гіршою при менших розмірах вибірки), але значна частина цього, здається, є тому, що залежність між чисельником і знаменником знизила рівень значущості. Якщо відрегулювати критичні значення належним чином, між ними буде мало, навіть при n = 10.

n=30

n = 30

введіть тут опис зображення

Це дозволяє припустити, що при невеликих розмірах вибірки між ними не так багато, доки не потрібно використовувати дуже малі рівні значущості.


Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.