У мене є дані для двох груп (тобто вибірки), які я хочу порівняти, але загальний розмір вибірки невеликий (n = 29) і сильно незбалансований (n = 22 проти n = 7).
Ці дані є логістично складними і дорогими для збору, тому, хоча "зібрати більше даних" як очевидне рішення в цьому випадку не корисно.
Було виміряно ряд різних змінних (дата відправлення, дата прибуття, тривалість міграції тощо), тому існує кілька тестів, деякі з яких дисперсії сильно відрізняються (менший зразок має більшу дисперсію).
Спочатку колега проводив t-тести на ці дані, а деякі були статистично значущими з P <0,001, інші не мали значущості при P = 0,069. Деякі зразки зазвичай розподілялися, інші - не. Деякі тести передбачали великі відхилення від «рівних» дисперсій.
У мене є кілька питань:
- чи підходять t-тести тут? Якщо ні, то чому? Чи застосовується це лише до тестів, де задовольняються припущення про нормальність та рівність відхилень?
- що є підходящою альтернативою? Можливо тест на перестановку?
- нерівна дисперсія надуває помилку типу I, але як? і який вплив має невеликий неврівноважений розмір вибірки на помилку I типу?