Невеликі та незбалансовані розміри вибірки для двох груп - що робити?


10

У мене є дані для двох груп (тобто вибірки), які я хочу порівняти, але загальний розмір вибірки невеликий (n = 29) і сильно незбалансований (n = 22 проти n = 7).

Ці дані є логістично складними і дорогими для збору, тому, хоча "зібрати більше даних" як очевидне рішення в цьому випадку не корисно.

Було виміряно ряд різних змінних (дата відправлення, дата прибуття, тривалість міграції тощо), тому існує кілька тестів, деякі з яких дисперсії сильно відрізняються (менший зразок має більшу дисперсію).

Спочатку колега проводив t-тести на ці дані, а деякі були статистично значущими з P <0,001, інші не мали значущості при P = 0,069. Деякі зразки зазвичай розподілялися, інші - не. Деякі тести передбачали великі відхилення від «рівних» дисперсій.

У мене є кілька питань:

  1. чи підходять t-тести тут? Якщо ні, то чому? Чи застосовується це лише до тестів, де задовольняються припущення про нормальність та рівність відхилень?
  2. що є підходящою альтернативою? Можливо тест на перестановку?
  3. нерівна дисперсія надуває помилку типу I, але як? і який вплив має невеликий неврівноважений розмір вибірки на помилку I типу?

Відповіді:


11

Т-тести, які передбачають однакові відхилення двох популяцій, не є дійсними, коли обидві групи мають різні відхилення, і це гірше для неоднакових розмірів вибірки. Якщо найменший розмір вибірки - найвища дисперсія, тест матиме завищену помилку типу I). Версія t-тесту Welch-Satterthwaite, з іншого боку, не передбачає рівних відмінностей. Якщо ви думаєте про тест на перестановку Фішера-Пітмана, він також передбачає однакові відмінності (якщо ви хочете зробити висновок про нерівні засоби з низького p-значення).

Є ще ряд речей, про які ви можете подумати:

(1) Якщо дисперсії явно неоднакові, ви все ще настільки зацікавлені в різниці між засобами?

(2) Чи можуть оцінки ефекту корисніші для вас, ніж значення p?

(3) Ви хочете розглянути багатоваріантність ваших даних, а не просто робити ряд одновимірних порівнянь?


Привіт Scortchi, дякую за вашу відповідь. Я розглядав поставлені вами питання:
ДеканP

2
(1) Як відхилення, так і середня величина можуть бути інформативними для нашого дослідження (наприклад, дати міграції виїздів можуть бути значно пізнішими для однієї сукупності ТА діапазон дат відправлення є більш змінним).
ДінP

3
(1) Щойно це згадувалося, тому що люди часто розглядають нерівні відхилення виключно як технічну проблему і забувають, що це сам цікавий факт.
Scortchi

2
(2) Я більше зауважував, що перелік p-значень, як правило, менш корисний, ніж перелік оцінок розміру ефекту (який може бути засобом, медіаном, відхиленнями чи іншим) із довірчими інтервалами. Особливо з невеликими зразками, довірчі інтервали можуть показувати, чи розміри ефектів, що мають практичне значення, все ще відповідають даним, навіть коли значення р є високим.
Scortchi

2
(3) Я думав про одну незалежну змінну (групу) та кілька залежних змінних (час міграції та с.): Цікава різниця між групами може бути зміною співвідношення між залежними змінними. Першим кроком буде приємна матриця з коробками або крапками, що порівнюють кожен відеокліп між групами по діагоналі, і розсипання для кожної пари DVD (знову ж розрізнення груп) в інших клітинках. Якщо чесно, то для дослідницького аналізу з невеликими розмірами вибірки це може бути останнім кроком.
Scortchi

1

По-перше, як вже зазначає Скорчі, T-тест не так добре підходить для ваших даних через його припущення щодо розподілу даних.

До вашого другого моменту я б запропонував альтернативу Т-тесту. Якщо ваш інтерес стосується лише того факту, якщо розподіли ваших двох зразків рівні чи ні, ви також можете спробувати скористатися двосторонньою версією тесту Вілкоксона за рангом. Тест Вілкоксона за ранговою сумою - непараметричний тест. Цей вид тесту особливо корисний, якщо ви не впевнені в базовому розподілі своїх даних.

Існує точне рішення тесту для невеликих розмірів зразків, а також для великих груп. Крім того, існує також пакет R, який реалізує тест Вілкоксона за ранговою сумою.

Оскільки це тест без параметрів, а також обробляє невеликі розміри вибірки, тест повинен добре відповідати вашому тестовому випадку.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.