Я займаюся дослідженнями навчальних ігор, і деякі мої поточні проекти передбачають використання даних BoardGameGeek (BGG) та VideoGameGeek (VGG) для вивчення взаємозв'язків між елементами дизайну ігор (тобто, "встановлених у Другій світовій війні", "включає кочення" ) та рейтинги гравців у цих іграх (тобто бали з 10). Кожен з цих елементів дизайну відповідає тегу в системі BGG або VGG, тому кожен елемент по суті є дихотомічною змінною. У грі є 1 для кожного тегу, який є в базі даних, і 0 для кожного тегу, який немає.
Таких міток є десятки, тому я хочу використовувати дослідницький факторний аналіз (EFA), щоб придумати керовану кількість "жанрів", які фіксують зразки в дизайні ігор. Консультуючись з декількома джерелами, я розумію, що, оскільки я працюю з дихотомічними змінними, мені слід використовувати поліхорні кореляції ( тетрахоричні , особливо тут) замість Пірсона , коли я придумую свої фактори (є й інші варіанти - наприклад, прихований аналіз ознак - там, але це я зараз досліджую).
З цікавості я придумав два набори факторів, один використовував кореляції Пірсона, а другий використовував поліхоричні кореляції (щоразу однакова кількість факторів). Моя проблема полягає в тому, що фактори, обчислені за допомогою кореляцій Пірсона, мають набагато більше сенсу і їх легше інтерпретувати, ніж фактори, обчислені за допомогою поліхоричних кореляцій. Іншими словами, "жанри" з першого набору факторів мають інтуїтивний сенс і відповідають моєму розумінню того, як типово розроблені ігри; це не стосується другого набору факторів.
З одного боку, я хочу переконатися, що я виконую припущення тестів, які використовую, навіть якщо це робить мої результати менш красивими. З іншого боку, я відчуваю, що частина мети факторного аналізу та (ширше) побудови моделі - придумати щось корисне, і більше корисної інформації з’являється, коли я «порушую правила». Чи достатньо потреби в корисній моделі, щоб переважати порушення припущень цього тесту? Які саме наслідки використання кореляцій Пірсона замість поліхорних?