Швидко оцініть (візуально) співвідношення між упорядкованими категоричними даними в R?

Я шукаю кореляції між відповідями на різні запитання в опитуванні ("гмм, давайте подивимося, чи відповідають відповіді на питання 11 кореспонденції з питаннями 78"). Усі відповіді категоричні (більшість з них варіюється від "дуже нещасних" до "дуже щасливих"), але деякі мають різний набір відповідей. Більшість з них можна вважати порядковими, тому розглянемо цей випадок тут.

Оскільки у мене немає доступу до комерційної програми статистики, я повинен використовувати Р.

Я спробував Rattle (безкоштовний пакет обміну даними для R, дуже чудовий), але, на жаль, він не підтримує категоричні дані. Я можу використати так, щоб імпортувати в R закодовану версію опитування, яка має цифри (1..5) замість "дуже нещасних" ... "щасливих" і нехай Раттл вважає, що це числові дані.

Я думав зробити графік розкидання і мати розмір крапки, пропорційний кількості чисел для кожної пари. Після деякого гуглінгу я виявив http://www.r-statistics.com/2010/04/correlation-scatter-plot-matrix-for-ordered-categorical-data/, але це здається мені дуже складним (для мене).

Я не статистик (але програміст) , але мали деякий читання в цьому питанні , і, якщо я правильно розумію, Rho Спірмена можна було б використовувати тут.

Отже, коротка версія запитання для тих, хто поспішає: чи є спосіб швидко побудувати Rho Spearman в R ? Сюжет є кращим перед матрицею чисел, тому що це простіший м'яч для очей, а також він може бути включений у матеріали.

Спасибі заздалегідь.

PS Я деякий час замислювався над тим, чи розміщувати це на головному веб-сайті або тут. Після пошуку обох сайтів щодо співвідношення R я відчув, що цей сайт краще підходить для запитання.

r correlation categorical-data data-visualization

— wishihadabettername
джерело

Вам здається, що R поступається програмному забезпеченню. :)

— Роман Луштрик

Для мене здається цілком розумним використовувати у вашому випадку співвідношення між моментом та моментом (припускаючи постійні дані) (якщо припустити достатню кількість балів за вашою шкалою, а не середню точку). Цілі сфери психології (наприклад, особистісна чи соціальна психологія) відпочивають (успішно) на припущенні, що відповіді на один предмет на, наприклад, п'ятибальній (або семиточковій) шкалі, починаючи від дуже un-X до дуже X, може бути трактуються як безперервні. Дивіться також цю тему: stats.stackexchange.com/questions/539/…

— Генрік,

@romunov: Не впевнений, як у вас склалося враження, що я вважаю, що R поступається іншим s / w. Але це зовсім не так.

— wishihadabettername

Я просто була розумною дупою. Я сподіваюся, що немає важких почуттів. :)

— Роман Луштрик

Відповіді:

Ще одна хороша візуалізація кореляції пропонується пакетом corrplot , що дає вам такі речі: alt текст

Це чудовий пакет.

Ознайомтесь і з відповіддю тут , можливо, вам це буде добре.

Нарешті, якщо у вас є пропозиції щодо того, як код у публікації, про який ви згадували, може бути простішим - будь ласка, повідомте мене про це.

— Тал Галілі
джерело

Дякую Талю, я зараз спробую попрацювати. Я також хотів би, щоб я знав, як спростити ваше рішення (з яким я пов’язаний у запитанні), але я просто новачок в R, щоб ви знали більше, ніж я. Я

— оновлю

Корпус добре виглядає. Це дає чудовий візуальний знімок розміру та напрямку кореляцій. У випадку 5-кратних упорядкованих категоричних змінних може бути корисним подати ще якусь міру асоціації, крім кореляції Пірсона: наприклад, поліхорні кореляції. На величину стандартних співвідношень Пірсона упорядкованих категоричних змінних дещо впливає середнє значення двох змінних.

— Джеромі Англім

Кілька додаткових сюжетних ідей:

Сюжет соняшнику
Графік розсіювання з тремтінням за допомогою базової графіки або ggplot2

— Джеромі Англім
джерело

Соняшник - цікаве рішення. Використання тремтіння - це те, що я спробував, коли вперше подивився на тему, але виявив, що це недостатньо ефективно для побудови кореляційних матриць ...

— Тал Галілі,

Так, тремтіння може стати досить безладним з матрицею розсипання з великою кількістю змінних. Я припускаю, що користь тремтіння та соняшнику полягає в тому, що ви можете побачити необроблені дані (хоча і обурені у випадку тремтіння).

— Джеромі Англім

Домовились (я люблю тремтіння, просто не за це :))

— Тал Галілі,