Як описати чи візуалізувати множинну лінійну регресійну модель


21

Я намагаюся підходити до моїх даних декілька лінійних регресійних моделей з парою вхідних параметрів, скажімо 3.

(i)Ж(х)=Ах1+Бх2+Сх3+габо(ii)Ж(х)=(А Б С)Т(х1 х2 х3)+г

Як пояснити та візуалізувати цю модель? Я міг би придумати такі варіанти:

  1. Згадайте рівняння регресії, як описано в (коефіцієнти, постійні) разом зі стандартним відхиленням, а потім графіком залишкової помилки, щоб показати точність цієї моделі. (i)

  2. Паралельні графіки незалежних та залежних змінних, наприклад:

    введіть тут опис зображення

  3. Після того, як коефіцієнти будуть відомі, чи можуть точки даних, які використовуються для отримання рівняння зведені до їх реальних значень. Тобто дані тренувань мають нові значення у вигляді x замість(i)х , x 2 , x 3 , ... де кожна незалежна змінна множиться на відповідний її коефіцієнт. Тоді ця спрощена версія може бути візуально показана як проста регресія, як ця:х1х2х3

    введіть тут опис зображення

Мене це бентежить, незважаючи на те, що я переглядаю відповідний матеріал на цю тему. Може хтось, будь ласка, пояснить мені, як "пояснити" множинну лінійну регресійну модель та як її візуально показати.


2
Яка мета вашого документа і хто такі аудиторії? Я б почав із отримання подібних статей і шукаю кілька прикладів того, як вони робляться у вашому власному полі. Я більше знайомий з біомедичною літературою і більшість часу ми просто використовуємо таблицю. Ілюстрації частіше спостерігаються, коли автори намагаються пояснити взаємодію.
Penguin_Knight

@Penguin_Knight, це в галузі інформатики, однак я думаю, що це більше, ніж обмежується певним доменом. Будь ласка, виправте мене, якщо я помиляюся.
Кріс

Хм ... хоч питання. Я б сказав, що єдина загальна частина для мене - це не показувати більше, ніж слід, і переконайтесь, що компоненти, на які слід підкреслити, дійсно підкреслюються. Навіть тільки на своєму полі я бачив усі три варіанти. 1) підсумовування підсумків є найпоширенішим, після чого 3), але в основному це форма побудови прогнозованого результату, а потім 2). Але для 2) я б використав те, що запропонував @gregory_britten: використовуйте скоригований X замість кожного окремого X.
Penguin_Knight

використовуйте графік розподілу .... подивіться на розподіл пристосованих значень, що є результатом моделі, і порівняйте їх з розподілом фактичних значень.
owais qureshi

Я знаю, що це ще з років тому, але якщо ви знову завітаєте сюди, чи можете ви опублікувати дані? Тоді б людям було з чим працювати, щоб показати різні можливості.
gung - Відновіть Моніку

Відповіді:


21

ХΔY/Δсг(Х). Таким чином, відстань, коефіцієнти якого дорівнюють нулю, займає відносну «важливість», і їх CI дає точність. Я думаю, що це підсумовує відносини досить добре і пропонує набагато більше інформації, ніж коефіцієнти та p.значення за їх природними та часто різними числовими шкалами. Приклад нижче:

введіть тут опис зображення

YХiYХ1+Х2+Х3ХiYavPlots()carlm

введіть тут опис зображення


Дякуємо @gregory_britten за цю інформацію. Проблема, яку я маю під рукою, має 8 незалежних змінних. Як ви вважаєте, "додані графіки змінної" були б розумними для великої кількості вхідних змінних?
kris

Відповідно до ідеї першого сюжету, якщо я працюю в R, я пропоную переглянути пакет RMS, який полегшує все це. Приємно те, що можна попросити змістовних крокових змін коваріації, тим самим уникаючи необхідності стандартизації.
Thomas Speidel

@suzanne Так, безумовно. Доданий графік змінної дає двовимірну перспективу для будь-якої кількості змінних. Це може бути особливо показовим у більш високих вимірах. Часто зустрічаються виявні закономірності у
залишках,

Я не дуже розумію позначення X1 | X2 та X3 в цьому контексті. Я знаю, як воно використовується стосовно ймовірностей, але я не можу повністю зрозуміти, що це тут говорить
Casebash

1
@Casebash Це часткова регресія на X1, наведені X2 та X3 є в моделі
gregory_britten

1

Оскільки всі вони мають відношення до пояснення причин цирозу, чи намагалися ви робити діаграму з міхуром / колом та використовувати колір, щоб вказати на різні регресори та радіус кола, щоб вказати на відносний вплив на цироз?

Я маю на увазі тут тип діаграми Google, який виглядає приблизно так:введіть тут опис зображення

І на незв’язну записку, якщо я не читаю ваші сюжети неправильно, я думаю, що у вас є якісь зайві регресори. Вино вже є спиртним, тому якщо ці два є окремими регресорами, не має сенсу тримати їх обох, якщо ваша мета - пояснити захворюваність цирозом.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.