Згідно з Фріцем, Моррісом та Ріхлером (2011; див. Нижче), може бути обчислений як розмір ефекту для U-тесту Манна-Вітні, використовуючи формулу Це зручно мене, як я повідомляю також і в інших випадках. Я хотів би повідомити про довірчий інтервал для на додаток до міри розміру ефекту.r = z rr
Ось мої запитання :
- Чи можна обчислити довірчі інтервали для r як для r Пірсона, хоча він використовується як міра розміру ефекту для непараметричного тесту?
- Про які довірчі інтервали потрібно повідомити для тестування з одним хвостиком та двостороннім?
Редагувати щодо другого питання: "Про які довірчі інтервали потрібно повідомити для тестування з одним хвостиком проти двосторонніх?"
Я знайшов ще трохи інформації про те, що ІМХО може відповісти на це питання. "Якщо двосторонні межі довіри утворюють довірчий інтервал, їх однобічні аналоги називають нижньою або верхньою довірчою межею." ( http://en.wikipedia.org/wiki/Confidence_interval ). З цієї інформації я роблю висновок, що не головне питання, чи було тестування на значущість (наприклад, test) одно- або двоступеневим, а яка інформація зацікавлена щодо КІ щодо розміру ефекту. Мій висновок (будь ласка, виправте мене, якщо ви не згодні):
- двостороння CI зацікавлена у верхній та нижній межах (як наслідок, можливо, що двосторонній CI приводить до 0, хоча однобічний тест значущості був p <0,05, особливо якщо значення було близьким до .05.)
- односторонній "CI" цікавить лише верхню або нижню межу (завдяки теоретичним міркуванням); однак це не обов'язково є головним питанням, що цікавить, після перевірки спрямованої гіпотези. Двосторонній ІС цілком доречний, якщо акцентовано увагу на можливому діапазоні розміру ефекту. Правильно?
Дивіться нижче текстовий уривок Fritz, Morris, & Richler (2011) щодо оцінки розмірів ефекту для тесту Манна-Вітні з статті, про яку я згадуюсь вище.
"Більшість описаних тут оцінок ефекту припускають, що дані мають нормальний розподіл. Однак деякі дані не відповідають вимогам параметричних тестів, наприклад, дані в порядковій, але не інтервальній шкалі. Для таких даних дослідники зазвичай звертаються до непараметричних статистичних тестів, таких як тести Манна – Вітні та Вілкоксона. Значимість цих тестів зазвичай оцінюється через наближення розподілів статистичних даних випробувань до розподілу, коли розміри вибірки не надто малі, і статистичні пакети, такі як SPSS, які виконують ці тести, подають відповідне значення на додаток до значень або ;z U T z z r r r 2 η 2 z r = zможна також обчислити вручну (наприклад, Siegel & Castellan, 1988). Значення може бути використане для обчислення розміру ефекту, такого як запропонований Коеном (1988); Керівні принципи Коена для r полягають у тому, що великий ефект - 5, середній ефект - 3, а малий - .1 (Coolican, 2009, стор. 395). З цих значень легко обчислити , або тому що і r2
Ці оцінки розміру ефекту залишаються незалежними від розміру вибірки, незважаючи на наявність N у формулах. Це тому, що z чутливий до розміру вибірки; поділ на функцію N знімає ефект розміру вибірки з оцінюваного розміру ефекту. "(стор. 12)