Як перевірити, чи відрізняється середнє значення підгрупи від загальної групи, що включає підгрупу?


9

Як я можу перевірити, чи середнє значення (наприклад, артеріальний тиск) підгрупи (наприклад, тих, хто помер) відрізняється від цілої групи (наприклад, у всіх, хто переніс захворювання, включаючи померлих)?

Ясна річ, що перша - це підгрупа другої.

Який тест гіпотези я повинен використовувати?


Ви перевіряєте різницю засобів?
Макрос

Відповіді:


9

Як зазначає Майкл, порівнюючи підгрупу із загальною групою, дослідники зазвичай порівнюють підгрупу з підмножиною загальної групи, яка не включає підгрупу.

Подумайте про це таким чином.

Якщо p - частка, яка загинула, і 1-p - частка, яка не померла, і

Х¯.=pХ¯г+(1-p)Х¯а

де Х¯. загальна середня сума, Х¯г - це середнє значення для тих, хто помер, і Х¯а- це середнє значення для тих, хто ще живий. Тоді

Х¯гХ¯а
якщо і тільки якщо коли

Х¯гХ¯.

Припустимо Хг¯Ха¯. ЗвідсиХ.¯pХг¯+(1-p)Хг¯=Хг¯.

Припустимо Х.¯Хг¯. Звідси Хг¯pХг¯+(1-p)Ха¯, тоді (1-p)Хг¯(1-p)Ха¯ і відтоді (1-p)0, тоді Хг¯Ха¯.

Те саме можна зробити і для нерівностей.

Таким чином, дослідники зазвичай перевіряють різницю між підгрупою та підмножиною загальної групи, яка не включає підгрупу. Це зумовлює показ того, що підгрупа відрізняється від загальної групи. Це також дозволяє використовувати звичайні методи, такі як незалежна група t-тесту.


1
Re: "Ви повинні порівнювати підгрупу з підмножиною загальної групи, яка не включає підгрупу" - так, це спосіб зробити це, але він задає дещо інше питання - він перевіряє мертве проти не мертве, коли воно ОП, схоже, ОП хоче перевірити різницю в засобах між мертвими та особами, смертність яких невідома, тому я не впевнений, чи слід це правильно сказати. Ви можете перевірити різницю в засобі між підмножиною та загальною групою до тих пір, поки не будете враховувати коефіцієнт міжХ¯г і Х¯.у вашому стандартному обчисленні помилок.
Макрос

@Macro хороший пункт. Дякую. Я трохи змінив формулювання на "типово дослідники ..."
Джеромі Англім

@Marco. Дякуємо за коментар Але як обчислюється коваріаціяХ¯г і Х¯не парних груп (підгрупа та група)?
giordano

@JeromyAnglim, я не думаю, що тобі потрібно "зазвичай". Якщо ми запишемо те, що ви написали в позначенні популяції (mu замість x-барів, наприклад) і вивчимо нульові та альтернативні гіпотези, тим самим аргументом, який ви зробили, тестування того, що mu відрізняється від mu_d, ідентичне тестуванню mu_a, відрізняється від mu_d. Отже, тест з двома зразками t-тесту завжди правильний. Тому замість типово я б сказав "еквівалентно провести цей тест двопробовим t-тестом"
Річард ДіСалво

2

Шляхом перевірки тут є порівняння тих, хто мав хворобу та помер, з тими, хто мав захворювання та не помер. Ви можете застосувати два зразка t-тесту або тест підсумків Уілкоксона, якщо нормальність неможливо припустити.


ти можеш бути більш конкретним? що таке два зразки t тесту? непарний тест? Я думав, що для ттестування, ви припускаєте НЕЗАЛЕЖНІСТЬ та НОРМАЛЬНІСТЬ.
користувач1061210

1
Коли групи розділені, як ми запропонували, вибірки є незалежними. Тест t не був би парним, оскільки підгрупи не повинні бути рівними, і немає природного способу сполучення зразків, навіть якщо розміри вибірки були рівними. Я згадав про тест Вілкоксона, оскільки припущення про нормальність може бути неправдивим, а тест Вілкоксона не вимагає нормальності.
Майкл Р. Черник

0

Що вам потрібно зробити, це перевірити наявність пропорцій населення (великий розмір вибірки). Статистика, що включає частку населення, часто має великий розмір вибірки (n => 30), тому нормальне наближення апроксимації та відповідна статистика використовуються для визначення тесту на вибірку вибірки (артеріальний тиск тих, хто помер) = частка населення (всі хто мав хворобу, включаючи померлу).

Тобто, коли розмір вибірки більший або дорівнює 30, ми можемо використовувати статистику z-балів для порівняння частки вибірки та частки сукупності, використовуючи значення стандартного відхилення вибірки p-hat, для оцінки стандартного відхилення вибірки, p якщо невідомо.

Розподіл вибірки P (пропорція) приблизно нормальний із середнім або очікуваним значенням, E (P) = p-hat і стандартна помилка, sigma (r) = sqrt (p * q / n).

Нижче наведено ймовірні питання тестової гіпотези, які можна задати, порівнюючи дві пропорції:

  1. (Тест з двома хвостами)

H0: p-hat = p vs H1: p-hat не дорівнює p

  1. (Тест на правий хвіст)

H0: p-hat = p vs H1: p-hat> p

  1. (Тест з лівим хвостом)

H0: p-hat = p vs H1: p-hat <p

Статистичні дані, які використовуються для тестування на великий розмір вибірки:

Статистика тестів пов'язана зі стандартним нормальним розподілом:

Статистика z-балів для пропорцій

p-hat-p / sqrt (pq / n)

, де p = пропорційна оцінка, q = 1-p і частка населення.

Середня пропорція:

np / n = p-hat = x / n

Стандартне відхилення:

= sqrt (npq / n) = sqrt (pq / n)

Правила прийняття рішення:

Тест на верхній хвіст (): (H0: P-hat> = P)

Прийміть H0, якщо Z <= Z (1-альфа)

Відхиліть H0, якщо Z> Z (1-альфа)

Низький хвіст (Ha: P-hat <= P):

Прийміть H0, якщо Z> = Z (1-альфа)

Відхиліть H0, якщо Z

Тест з двома хвостами (Ha: P-капелюх не дорівнює P):

Прийміть H0, якщо Z (альфа / 2) <= Z <= Z (1-альфа / 2)

Відхиліть H0, якщо Z <Z (альфа / 2) або якщо Z> Z (1-альфа / 2)

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.