Я шукаю кореляції між відповідями на різні запитання в опитуванні ("гмм, давайте подивимося, чи відповідають відповіді на питання 11 кореспонденції з питаннями 78"). Усі відповіді категоричні (більшість з них варіюється від "дуже нещасних" до "дуже щасливих"), але деякі мають різний набір відповідей. Більшість з них можна вважати порядковими, тому розглянемо цей випадок тут.
Оскільки у мене немає доступу до комерційної програми статистики, я повинен використовувати Р.
Я спробував Rattle (безкоштовний пакет обміну даними для R, дуже чудовий), але, на жаль, він не підтримує категоричні дані. Я можу використати так, щоб імпортувати в R закодовану версію опитування, яка має цифри (1..5) замість "дуже нещасних" ... "щасливих" і нехай Раттл вважає, що це числові дані.
Я думав зробити графік розкидання і мати розмір крапки, пропорційний кількості чисел для кожної пари. Після деякого гуглінгу я виявив http://www.r-statistics.com/2010/04/correlation-scatter-plot-matrix-for-ordered-categorical-data/, але це здається мені дуже складним (для мене).
Я не статистик (але програміст) , але мали деякий читання в цьому питанні , і, якщо я правильно розумію, Rho Спірмена можна було б використовувати тут.
Отже, коротка версія запитання для тих, хто поспішає: чи є спосіб швидко побудувати Rho Spearman в R ? Сюжет є кращим перед матрицею чисел, тому що це простіший м'яч для очей, а також він може бути включений у матеріали.
Спасибі заздалегідь.
PS Я деякий час замислювався над тим, чи розміщувати це на головному веб-сайті або тут. Після пошуку обох сайтів щодо співвідношення R я відчув, що цей сайт краще підходить для запитання.