У мене є дані, за якими я розраховував співвідношення Спірмена і хочу їх візуалізувати для публікації. Залежна змінна класифікується, незалежна змінна - ні. Те, що я хочу візуалізувати, - це більше загальна тенденція, ніж власне схил, тому я класифікував незалежний та застосував кореляцію / регресію Спірмена. Але тільки коли я склав свої дані і збирався вставити їх у свій рукопис, я натрапив на це твердження (на цьому веб-сайті ):
Ви майже ніколи не будете використовувати регресійну лінію ні для опису, ні для прогнозування, коли будете проводити кореляцію рейтингу Спірмена, тому не обчислюйте еквівалент лінії регресії .
і пізніше
Дані кореляції рейтингу Спірмена можна графікувати так само, як і для лінійної регресії чи кореляції. Не додайте на графік лінії регресії ; було б оманливим ставити на графік лінійну регресійну лінію, коли ви її аналізували за допомогою рангової кореляції.
Річ у тім, що регресійні лінії не так відрізняються від тих, коли я не класифікую незалежні та обчислюю співвідношення Пірсона. Тенденція така ж, але через непомірну плату за кольорову графіку в журналах я пішов з монохромним поданням, а фактичні точки даних накладаються настільки, що їх не впізнати.
Звичайно, я міг би обходити це, роблячи два різних сюжети: Один для даних даних (ранжирований) і один для лінії регресії (невизначений), але якщо виявиться, що джерело, яке я цитував, є невірним або проблема Як би це не проблематично в моєму випадку, це полегшило б моє життя. (Я також бачив це питання , але воно мені не допомогло.)
Редагувати для отримання додаткової інформації:
Незалежна змінна на осі x представляє кількість ознак, а залежна змінна по осі y представляє ранг, якщо алгоритми класифікації порівняно за їх ефективністю. Зараз у мене є кілька алгоритмів, які в середньому можна порівняти, але те, що я хочу сказати зі своїм сюжетом, є щось на кшталт: "У той час як класифікатор A покращується, тим більше можливостей, але класифікатор B краще, коли менше функцій"
Змініть 2, щоб включити мої сюжети:
Ранги алгоритмів, побудовані в залежності від кількості функцій
Ранги алгоритмів побудовані в залежності від рангованої кількості ознак
Отже, щоб повторити запитання із назви:
Чи добре будувати лінію регресії для ранжированих даних кореляції / регресії Спірмена?