Це додаткове запитання до того, що тут написав Френк Харрелл :
На мій досвід, необхідний розмір вибірки для точного розподілу t часто перевищує розмір вибірки. Як ви вже говорили, тест з підписом Wilcoxon є надзвичайно ефективним, і він надійний, тому я майже завжди віддаю перевагу йому над тестом t
Якщо я правильно це розумію - при порівнянні місця розташування двох невідповідних зразків, ми б вважали за краще використовувати тест рейтингової суми Wilcoxon для непарного t-тесту, якщо розміри нашої вибірки невеликі.
Чи існує теоретична ситуація, коли ми віддаємо перевагу тесту Вілкоксона за ранговою сумою перед непарним тестом, навіть якщо розміри вибірки наших двох груп порівняно великі?
Моя мотивація до цього питання випливає зі спостереження, що для одного тестового зразка, використовуючи його для не дуже малого зразка перекошеного розподілу, виникла помилка помилки I типу:
n1 <- 100
mean1 <- 50
R <- 100000
P_y1 <- numeric(R)
for(i in seq_len(R))
{
y1 <- rexp(n1, 1/mean1)
P_y1[i] <- t.test(y1 , mu = mean1)$p.value
}
sum(P_y1<.05) / R # for n1=n2=100 -> 0.0572 # "wrong" type I error