Відображення звичайних даних - засоби, медіани та середні ранги

У мене є кілька порядкових даних, які зазвичай не поширюються, тому я вирішив зробити непараметричне тестування за допомогою тесту Манна-Вітні U. Я розглядаю відмінності між групами для семи балів - ці оцінки становлять 0, 1, 2 або 3 для кожного предмета. Мені важко зрозуміти, як відобразити мої дані!

Якщо я подаю дані за допомогою медіанів (та IQR медіанів), то зовсім не ясно, де розбіжності, оскільки здебільшого медіани потрапляють або на 0, або на 1. Отже, незважаючи на тест Манна-Вітні U, що показує значні відмінності, стіл просто виглядає нецікаво.

Я також міг представити дані, використовуючи засоби . Існує декілька наукових праць, які говорять про те, що ви можете використовувати засоби з порядковими даними, але ви не можете робити однотипні припущення щодо відмінностей між балами (наприклад, різниця між 0 і 1 не така, як між 1 і 2). Використання засобів було б трохи суперечливим, хоча цифри в таблиці добре розповідають історію, коли я їх використовую.

Третім варіантом є використання середніх рангів, які мені дає SPSS у висновку Mann-Whitney. Середні ранги - це те, що порівнюється між групами, тож, можливо, я повинен просто їх використовувати? Єдиною проблемою, що я маю з цим, є те, що середні ранги насправді нічого не означають щодо фактичних даних (наприклад, я не бачу, що суб'єкти ближче до 3, в той час як елементи управління ближче до 1, використовуючи середні ранги.)

І останнім варіантом було проведення хі-квадратного аналізу, порівнюючи суб'єкти та елементи контролю після розподілу балів на дві групи (0 і 1 для низьких та 2 і 3 для високих). Однак коли я це робив, відмінності були не такими яскраво вираженими (ймовірно, з ряду причин).

— Ерік
джерело

Ви питаєте про те, як найкраще представити свої дані у тексті, таблиці чи на малюнку?

— gung - Відновити Моніку

І текст, і таблиця. У тексті, який я хочу сказати, були істотні відмінності між групами щодо декількох компонентів мого опитування сну. Ці відмінності є за допомогою тесту Манна-Вітні, тому вони порівнюють середні ранги. Я не знаю, як я повинен подати ці відмінності в таблиці. Використання медіанів не працює, оскільки вони занадто схожі, і ви не бачите відмінностей. Засоби працюють краще, але здається дивним використання параметричних заходів у таблиці, яка повинна стосуватися непараметричних медіанів. І середні ранги працювали б, але вони не представляють фактичних значень.

— Ерік

Цікаво, чи можна відповісти з " Графіку" на співвідношення двох порядкових змінних для ваших цілей? На прикладних графіках показано співвідношення двох змінних, кожна з яких має п'ять рівнів, але якщо ви, наприклад, порівнюєте дві групи і у вас є чотири можливі рівні, ви можете повторно уявити деякі з цих візуалізацій як 4-на-2 замість 5-на- 5, можливо.

— Срібна рибка

Це може бути корисно, якщо ви можете розмістити деякі (можливо, цілком хибні) приклади даних, щоб люди, які хочуть продемонструвати можливу техніку, мали з чим працювати.

— Срібна рибка

Ерік, за визначенням непараметричного тесту, зокрема, Ман-Уітні, порівнює (за домінуванням) два розподіли взагалі, він не порівнює значення конкретного параметра розподілу, такого як середнє чи середнє. Не існує єдиного числа, яке є характеристикою розподілу, і в той же час є те, що порівнюється, в цьому випадку. Ви можете використовувати 2-зразковий оцінювач Ходжеса-Леманна, але це характерна різниця між двома розподілами, а не кожним з двох розподілів.

— ttnphns

Це відмінне запитання. Як ви з’ясували, кванти не працюють, коли в даних багато зв'язків, оскільки вони занадто розривні, як оцінки. Я часто вважаю, що найкраще працювати, якщо ви можете припустити, що інтервали між категоріями є принаймні "наполовину значущими". Ймовірності перевищення завжди дійсні. У вашому випадку це було б оцінено за часткою спостережень . Середні ранги корисні при порівнянні груп, але я не бачу такої користі для однієї змінної. $\geq 1, \geq 2, =3$

Правильність використання середнього для узагальнення порядкових змінних рідко може випливати з самих даних. Це суб'єктивно.

Замість використання середніх рангів я застосував би відповідний показник кореляції рангів або ймовірність узгодження (простий лінійний переклад статистики Вілкоксона-Манна-Вітні; це середній ранг спостережень в одній з двох груп, розділених на постійну) між дві змінні (наприклад, бінарне групування та порядкова шкала). Вибір коефіцієнтів кореляції включає (що відповідає ймовірності конкордансу і штрафує за зв'язки на порядковій змінній) та Гудмана-Крускала яка не штрафує за зв'язки ні ні . $D_{xy}$ $\gamma$ $x$ $y$

— Френк Харрелл
джерело

Привіт Френк, дякую за вашу продуману відповідь. Якщо ви не заперечуєте, у мене є кілька наступних питань. Щодо засобів - я вважаю, що категорії мають, принаймні, наполовину змістовні значення, оскільки вони в основному посилаються на "ні, легкі, помірні та серйозні порушення". Чи є вам відомі посилання, які я можу використати як прецедент для цього? Я також вагаюся використовувати засоби лише в одній таблиці, а медіани в інших заради послідовності. І щодо середніх рангів - я вважаю, що я порівнюю групи - предмети та контролі на 7 балів. Чи порівняння середніх рангів прийнятне / корисне?

— Ерік

Для числових порядкових даних з кількома рівнями, таких як підрахунки та, можливо, ваш приклад порушення, корисні засоби, а медіани не є (через занадто багато зв'язків). Є багато випадків, коли я використовував засоби для порядкових даних і медіани для косих безперервних, в одній таблиці.

— Френк Харрелл