Параметр нецентральності - що це таке, що він робить, що було б запропонованим значенням?


11

Я намагався підняти свої статистичні знання, особливо стосовно визначення розміру вибірки та статистичного аналізу потужності. Але здається, що чим більше я читаю, тим більше мені потрібно читати.

У будь-якому випадку я знайшов інструмент під назвою G * Power, який, здається, робить усе, що мені потрібно, але у мене виникає проблема, що розуміє параметр нецентральності, що це таке, що він робить, що було б запропоноване значення тощо?

Інформація про Вікіпедію тощо є неповною, або я не дуже добре розумію її.

Я провожу серію з двох хвостих z-тестів, якщо це допоможе.

ps Чи може хтось додати кращі теги до цього питання?

Відповіді:


8

У розрахунках потужності ми калібруємо тести, використовуючи знання про те, яким буде розподіл вибірки тестової статистики під нульовою гіпотезою. Зазвичай з цього випливає або звичайний розподіл. Це дозволяє обчислити "критичні значення", для яких значення, що перевищують це, вважаються занадто невідповідними тому, що можна було б очікувати, якби нуль був істинним.χ2

Потужності статистичного тесту обчислюється шляхом визначення моделі ймовірності для процесу формування даних в відповідності з альтернативної гіпотезою і обчисленням розподілу вибірки для однієї і тієї ж тестової статистики. Тепер це набуває іншого розподілу.

Для тестової статистики, що має розподіл під нулем, вони беруть не центральний під альтернативу, яку ви створюєте. Це дуже складні дистрибуції, але стандартне програмне забезпечення може легко обчислити щільність, розподіл і квантили для них. Хитрість полягає в тому, що вони є згорткою стандартних густин та пуассонових густин. В R, то , і функції у всіх є додатковий аргумент , який, за замовчуванням, 0.χ2χ2χ2dchisqpchisqrchisqncp

Якщо тестова статистика має стандартний нормальний розподіл під нульовою гіпотезою, вона матиме ненульове середнє нормальне розподіл під альтернативу. Тут це значення - параметр нецентральності. Для t-тесту при допущенні рівної дисперсії середнє значення задається:

δ=μ1μ2σpooled/n

введіть тут опис зображення

У будь-якому випадку дані, сформовані за альтернативною гіпотезою, матимуть статистику тестування після деякого нецентрального розподілу з параметром нецентральності ( ). є іноді невідома, часто складною функцією інших параметрів генерації даних.δδ


Я розумію, чому випадкова вибірка призведе до нормально розподіленого середнього, якщо нульова гіпотеза була правдивою (ваша чорна лінія). Але Мережа дала мені суперечливі описи розподілу за альтернативою (тобто, коли вважається , що відрізняється від ) - у вашому випадку це також нормально (червона лінія), але наприклад, Real-statistics.com показав його потрібно перекосити (див. зображення на півдорозі сторінки). Звичайно, я пропустив фокус. Чи можете ви допомогти мені прояснити речі? μ2μ1
Бен

@ben Я не намалював нецентральний T, я намалював силу статистичного тесту (червона область, затінена). Нецентральний розподіл Chi-sq описує цю область під час розрахунку потужності.
AdamO
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.