Швидко оцініть (візуально) співвідношення між упорядкованими категоричними даними в R?


11

Я шукаю кореляції між відповідями на різні запитання в опитуванні ("гмм, давайте подивимося, чи відповідають відповіді на питання 11 кореспонденції з питаннями 78"). Усі відповіді категоричні (більшість з них варіюється від "дуже нещасних" до "дуже щасливих"), але деякі мають різний набір відповідей. Більшість з них можна вважати порядковими, тому розглянемо цей випадок тут.

Оскільки у мене немає доступу до комерційної програми статистики, я повинен використовувати Р.

Я спробував Rattle (безкоштовний пакет обміну даними для R, дуже чудовий), але, на жаль, він не підтримує категоричні дані. Я можу використати так, щоб імпортувати в R закодовану версію опитування, яка має цифри (1..5) замість "дуже нещасних" ... "щасливих" і нехай Раттл вважає, що це числові дані.

Я думав зробити графік розкидання і мати розмір крапки, пропорційний кількості чисел для кожної пари. Після деякого гуглінгу я виявив http://www.r-statistics.com/2010/04/correlation-scatter-plot-matrix-for-ordered-categorical-data/, але це здається мені дуже складним (для мене).

Я не статистик (але програміст) , але мали деякий читання в цьому питанні , і, якщо я правильно розумію, Rho Спірмена можна було б використовувати тут.

Отже, коротка версія запитання для тих, хто поспішає: чи є спосіб швидко побудувати Rho Spearman в R ? Сюжет є кращим перед матрицею чисел, тому що це простіший м'яч для очей, а також він може бути включений у матеріали.

Спасибі заздалегідь.

PS Я деякий час замислювався над тим, чи розміщувати це на головному веб-сайті або тут. Після пошуку обох сайтів щодо співвідношення R я відчув, що цей сайт краще підходить для запитання.


2
Вам здається, що R поступається програмному забезпеченню. :)
Роман Луштрик

Для мене здається цілком розумним використовувати у вашому випадку співвідношення між моментом та моментом (припускаючи постійні дані) (якщо припустити достатню кількість балів за вашою шкалою, а не середню точку). Цілі сфери психології (наприклад, особистісна чи соціальна психологія) відпочивають (успішно) на припущенні, що відповіді на один предмет на, наприклад, п'ятибальній (або семиточковій) шкалі, починаючи від дуже un-X до дуже X, може бути трактуються як безперервні. Дивіться також цю тему: stats.stackexchange.com/questions/539/…
Генрік,

@romunov: Не впевнений, як у вас склалося враження, що я вважаю, що R поступається іншим s / w. Але це зовсім не так.
wishihadabettername

Я просто була розумною дупою. Я сподіваюся, що немає важких почуттів. :)
Роман Луштрик

Відповіді:


19

Ще одна хороша візуалізація кореляції пропонується пакетом corrplot , що дає вам такі речі: alt текст

Це чудовий пакет.

Ознайомтесь і з відповіддю тут , можливо, вам це буде добре.

Нарешті, якщо у вас є пропозиції щодо того, як код у публікації, про який ви згадували, може бути простішим - будь ласка, повідомте мене про це.


1
Дякую Талю, я зараз спробую попрацювати. Я також хотів би, щоб я знав, як спростити ваше рішення (з яким я пов’язаний у запитанні), але я просто новачок в R, щоб ви знали більше, ніж я. Я
оновлю

Корпус добре виглядає. Це дає чудовий візуальний знімок розміру та напрямку кореляцій. У випадку 5-кратних упорядкованих категоричних змінних може бути корисним подати ще якусь міру асоціації, крім кореляції Пірсона: наприклад, поліхорні кореляції. На величину стандартних співвідношень Пірсона упорядкованих категоричних змінних дещо впливає середнє значення двох змінних.
Джеромі Англім

3

Кілька додаткових сюжетних ідей:


Соняшник - цікаве рішення. Використання тремтіння - це те, що я спробував, коли вперше подивився на тему, але виявив, що це недостатньо ефективно для побудови кореляційних матриць ...
Тал Галілі,

Так, тремтіння може стати досить безладним з матрицею розсипання з великою кількістю змінних. Я припускаю, що користь тремтіння та соняшнику полягає в тому, що ви можете побачити необроблені дані (хоча і обурені у випадку тремтіння).
Джеромі Англім

Домовились (я люблю тремтіння, просто не за це :))
Тал Галілі,
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.