Я вже читав усі сторінки цього сайту, намагаючись знайти відповідь на свою проблему, але, здається, ніхто не формує мене ...
Спочатку я поясню вам тип даних, з якими я працюю ...
Скажімо, у мене є вектор масиву з кількома назвами міста, по одному для кожного з 300 користувачів. У мене також є інший вектор масиву з оцінкою відповіді на опитування кожного користувача або безперервне значення для кожного користувача.
Я хотів би знати, чи існує коефіцієнт кореляції, який обчислює кореляцію між цими двома змінними, між номінальною та числовою / безперервною чи порядковою змінними.
Я шукав в Інтернеті, а на деяких сторінках вони пропонують використовувати коефіцієнт непередбачуваності або коефіцієнт Креймера V або коефіцієнт лямбда або Ета. Для кожного з цих заходів просто скажіть, що вони можуть бути застосовані для таких даних, у яких у нас є номінальна змінна та інтервальна чи числова змінна. Вся справа в тому, що пошук і пошук, намагаючись зрозуміти кожен з них, колись пишеться або переглядає приклади, що їх розумно використовувати, якщо у вас є дихотомна номінальна змінна, за винятком V в Cramer, інший час не пишеться жодна вимога для тип даних. Багато інших сторінок говорять про те, що правильно застосовувати регресію замість цього, це правильно, але я просто хотів би знати, чи є такий коефіцієнт, як груша / сперман для такого роду даних.
Я також вважаю, що не так правильно використовувати коефіцієнт кореляції Спірмена, оскільки міста не є сортовими.
Я також створив функцію Cramer'sV і Eta сам (я працюю з Matlab), але для Ети вони не говорять про будь-яке значення p, щоб побачити, чи є коефіцієнт статистично значущим ...
На сайті matlabWorks також є приємна панель інструментів, яка говорить про обчислення ета ^ 2, але тип введення, який він потребує, не зрозумілий.
Хтось тут зробив тест, як у мене? Якщо вам потрібна більш детальна інформація, щоб зрозуміти тип даних, які я використовую, просто запитайте мене, і я спробую пояснити вам краще.