Як ви повідомляєте про тест Манна – Вітні?


10

Я займаюся дисертацією, і я проводжу ряд тестів. Після використання тесту Крускала – Уолліса я зазвичай повідомляю результат так:

Існує значна різниця між засобами ...(χ(2)2=7.448,p=.024)

Але зараз я провів тест Манна – Уїтні, і я не впевнений, які цінності подати. SPSS дає мені значення Mann – Whitney , Wilcoxon , і значення. Я представляю всі ці 4 значення? Або якісь неактуальні?UWZP

Відповіді:


12

Вікіпедія, здається, має ваші відповіді. Ось уривок із прикладу констатації результатів:

Звітуючи результати тесту Манна - Вітні, важливо констатувати:

  • Вимірювання центральних тенденцій двох груп (засобів або медіанів; оскільки Манна-Вітні є порядковим тестом, зазвичай рекомендують медіанів)
  • Значення U
  • Розміри вибірки
  • Рівень значущості.

На практиці частина цієї інформації, можливо, вже була надана, і здоровий глузд повинен використовуватися при вирішенні питання про повторення. Типовий звіт може працювати,

"Середні затримки в групах E і C склали 153 і 247 мс; розподіли в двох групах суттєво відрізнялися (Манн-Уїтні U = 10,5, n 1 = n 2 = 8, P <0,05 двохвоста)".

Тест з підписанням Вілкоксона підходить для парних зразків, тоді як тест Манна - Вітні передбачає незалежні вибірки. Однак, згідно з Field (2000) , Wilcoxon у вашому висновку SPSS є "іншою версією цієї статистики, яка може бути перетворена в бал Z і, отже, може бути порівняна з критичними значеннями нормального розподілу". Це також пояснює ваш бал!zWz

FYI, Вікіпедія додає, що для великих зразків приблизно нормально розподіляється. Беручи під увагу всі ці значення, можна також розрахувати величину ефекту , що в разі прикладу Вікіпедії є 0,319 (калькулятор реалізований в розділі 11 тут ). Однак це перетворення тестової статистики залежить від наближеної нормальності , тому воно може бути неточним з n s = 8 ( Fritz et al., 2012 ) .Uη2U

PS Результати тесту Крускала - Уолліса не слід трактувати як виявлення відмінностей між засобами, за винятком особливих обставин. Детальну інформацію див. У відповіді @ Glen_b на інше запитання "Різниця між тестом ANOVA та тестом Крускала-Уолліса" .

Список літератури

Польовий, А. (2000). 3.1. Тест Манна-Вітні. Методи дослідження 1: SPSS для Windows, частина 3: Непараметричні тести. Отримано з http://www.statisticshell.com/docs/nonparametric.pdf .
Fritz, CO, Morris, PE, & Richler, JJ (2012). Оцінка розміру ефекту: поточне використання, розрахунки та інтерпретація. Журнал експериментальної психології: Загальний , 141 (1), 2–18. PDF доступний через ResearchGate .


3
Який сенс повідомляти про значення U у наведеному вище прикладі? Що я, як читач, отримую від того, що знаю, що U - 10,5?
амеба

4
У наведеному вище прикладі ви отримуєте можливість обчислити точний , який не заданий і може бути корисним для оцінки розміру ефекту, мета-аналізу або перевірки на -змінення. Друг і мій колега @rpierce також порадили мені тестову статистику звіту , щоб забезпечити читач , що я роблю речі належним чином в цілому, так як він зловив багато опублікованих статей робить це неправильно з допомогою повідомлені статистик тестів і пов'язаного . ppdf
Нік Стаунер

Цікаво. Я думаю, що це питання може бути гідним окремого питання, яке я можу задати тут у якийсь момент. Все-таки: якщо хочеться точних p-значень, то можна повідомити точні p-значення! Насправді, звичайна порада - повідомляти точні p-значення, якщо вони не дуже малі, як p <0,0001; але в цьому випадку p-хакерство малоймовірне. І про розмір ефекту в будь-якому разі слід повідомляти окремо, наприклад, "у середній цитаті із вікі" середні затримки в групах E та C склали 153 та 247 мс ".
амеба

1
Секретна (тобто не піддається пошуку) група Facebook для психічних шкіл нашої альма-матер; жодних прикладів не включено. Мені теж цікаво. Можливо, ви можете змусити його поділитися деякими, якщо ви позначите його окремим запитанням :) Я думаю, що у інших тут буде багато прикладів для того, щоб зазвучати - тобто, якщо питання не закриється як-небудь поза темою. ! Безумовно, більш основне питання на кшталт "Чому важливо звітувати про статистику тестів на додаток до та розміру ефекту?" Буде тематично, хоча, я думаю ... Спершу перевірте наявність дублікатів під тегом звітування , якщо ви дійсно хочете бути в безпеці ...p
Nick Stauner

1
Якщо розміри вибірки не такі малі, що їх буде неправильно трактувати, я схиляюся до повідомлення про стандартизовані U або W (стандартизовані, вони однакові) як значення Z ( скажіть ), оскільки читачі матимуть інтуїтивний сенс що це означає - хоча тоді стає необхідним зрозуміти, коли у вас є точне p-значення, якщо у вас є, а не одне, що не базується на оцінці Z для статистики. ZU
Glen_b -Встановити Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.