Що пояснює доданий змінний графік (Частичний графік регресії) за допомогою множинної регресії?


18

У мене є модель набору даних Movies, і я використовував регресію:

model <- lm(imdbVotes ~ imdbRating + tomatoRating + tomatoUserReviews+ I(genre1 ** 3.0) +I(genre2 ** 2.0)+I(genre3 ** 1.0), data = movies)
library(ggplot2)
res <- qplot(fitted(model), resid(model))
res+geom_hline(yintercept=0)

Що дало вихід:

введіть тут опис зображення

Тепер я спробував працювати щось, що називається Додана змінна ділянка вперше, і я отримав такий результат:

car::avPlots(model, id.n=2, id.cex=0.7)

Додано змінний сюжет

Проблема полягає в тому, що я намагався зрозуміти доданий сюжет змінної за допомогою google, але я не міг зрозуміти його глибину, побачивши сюжет, я зрозумів, що своєрідне подання перекосу засноване на кожній вхідній змінній, що стосується виводу.

Чи можу я отримати більш детальну інформацію про те, як це виправдовує нормалізацію даних?


4
@Silverfish приємно відповів на ваше запитання. Що стосується невеликих деталей того, що робити з вашим конкретним набором даних, лінійна модель виглядає дуже поганою ідеєю. Голоси - це явно сильна скасована негативна змінна величина, тому щось подібне до моделі Пуассона. Дивіться, наприклад, blog.stata.com/tag/poisson-regression Зауважте, що така модель не зобов'язує вас припускати, що граничний розподіл відповіді саме на Пуассона більше ніж стандартна лінійна модель зобов'язує вас постулювати граничну нормальність.
Нік Кокс

2
Один із способів бачити, що лінійна модель погано працює - це зазначити, що вона передбачає негативні значення для значної частини випадків. Дивіться область зліва від пристосованого на першому залишковому ділянці. =0
Нік Кокс

Дякую Ніку Коксу, тут я виявив, що існує сильно перекошений негативний характер, я повинен розглянути модель Пуассона, тому є якесь посилання, яке дає мені належне уявлення про те, яку модель використовувати в якому сценарії на основі набору даних, і я спробував використовувати Поліноміальна регресія для мого набору даних, це буде правильний вибір тут ...
Abhishek Choudhary

1
Я вже дав посилання, яке в свою чергу дає подальші посилання. Вибачте, але я не розумію другу половину вашого питання з посиланням на "сценарій на основі набору даних" та "поліноміальна регресія". Я підозрюю, що вам потрібно задати нове запитання з набагато детальнішою інформацією.
Нік Кокс

Який пакет ви встановили, щоб R розпізнав функцію avPlots?
Іса

Відповіді:


36

Для ілюстрації я візьму менш складну регресійну модель Y=β1+β2X2+β3X3+ϵ де мінливі прогнози X2 і X3 можуть бути корельованими. Скажімо, нахили β2 і β3 є позитивними, тому можна сказати, що (i) Y збільшується зі збільшенням X2 , якщо X3 підтримується постійним, оскільки β2 є позитивним; (ii) Yзбільшується в міру збільшення X3 , якщо X2 підтримується постійним, оскільки β3 позитивний.

Зауважте, що важливо інтерпретувати множинні коефіцієнти регресії, враховуючи, що відбувається, коли інші змінні підтримуються постійними ("ceteris paribus"). Припустимо, я просто регресував Y проти X2 з моделлю Y=β1+β2X2+ϵ . Моя оцінка коефіцієнта нахилу β2 , який вимірює вплив на Y збільшення одиничної величини постійної X2 , може відрізнятися від моєї оцінки β 2 без утримання X3β2 множинної регресії - що також вимірює вплив наY збільшення на одну одиницю вX2 , але церобитьутриманняX3 константу. Проблема моєї оцінкиβ2^ полягає в тому, що вона страждає відзміщення пропущеної змінної,якщоX2 кореляція і X3 .

Щоб зрозуміти, чому, уявіть, що X2 і X3 негативно співвідносяться. Тепер, коли я збільшую X2 на одну одиницю, я знаю, що середнє значення Y повинно зростати, оскільки β2>0 . Але , як X2 збільшується, якщо ми не будемо тримати X3 константу , то X3 має тенденцію до зниження, а з β3>0 це буде мати тенденцію до скорочення середнього значення Y . Тож загальний ефект від збільшення одиниці на X2 виявиться меншим, якщо я дозволю X3 щоб змінюватись також, отже,β2<β2 . Все погіршується, чим сильніше співвідносяться X2 і X3 , і чим більший ефект від X3 через β3 - в дійсно важкому випадку ми можемо навіть знайти β2<0 хоча ми знаємо це, ceteris paribus, X2 позитивно впливає на Y !

Сподіваємось, ви тепер можете зрозуміти, чому малювання графіка Y проти X2 було б поганим способом візуалізації взаємозв'язку між Y та X2 у вашій моделі. У моєму прикладі ваш погляд буде притягнутий до лінії, що найкраще підходить із нахилом β2^ , який не відображає β2^ з вашої регресійної моделі. У гіршому випадку ваша модель може передбачити, що Y збільшується зі збільшенням X2 (при інших змінних, що зберігаються постійними), але точки на графіку дозволяють припустити, що Y зменшується зі збільшенням X2 .

Проблема полягає в тому, що в простому графіку Y проти X2 інші змінні не вважаються постійними. Це найважливіше розуміння переваги доданої змінної ділянки (її також називають частковою регресійною графікою) - вона використовує теорему Фріша-Вон-Ловелла для "часткового усунення" ефекту інших прогнокторів. Горизонтальні та вертикальні осі на графіку, мабуть, найлегше зрозуміти * як " X2 після обліку інших прогнозів" та " Y після обліку інших прогнозів". Тепер ви можете подивитися на взаємозв'язок між Y та X2 після того, як були враховані всі інші прогнози. Так, наприклад, нахил, який ви можете побачити в кожному сюжеті, тепер відображає часткові коефіцієнти регресії з вашої оригінальної моделі множинної регресії.

Багато значення доданої ділянки змінної ділянки надходить на етапі діагностики регресії, тим більше, що залишки в доданому змінному графіку є саме залишками від вихідної множинної регресії. Це означає, що переживаючі та гетероскедастичні властивості можна визначити аналогічно, як при розгляді сюжету простої, а не множинної регресійної моделі. Також можна помітити впливові моменти - це корисно при багаторазовій регресії, оскільки деякі впливові моменти не є очевидними в початкових даних, перш ніж брати до уваги інші змінні. У моєму прикладі помірно велике значення X2 може не виглядати поза місцем у таблиці даних, але якщо значення X3 також велике, незважаючи на X2 і X3X3 негативно співвідносяться, тоді комбінація зустрічається рідко. "Облік інших прогнокторів", значення X2 незвичайно велике і буде помітніше на вашій доданій змінній графіку.

Більш технічно вони будуть залишками від запуску двох інших множинних регресій: залишки від регресуванняY проти всіх предикторів, крімX2 йдуть по вертикальній осі, тоді як залишки від регресіїX2 проти всіх інших предикторів йдуть по горизонтальній осі. Це дійсно те, щорозповідаютьлегенди про "Y дали іншим" та "X2 дано іншим". Оскільки середнє залишкове значення для обох цих регресій дорівнює нулю, середня точка (X2 задано іншими,YX2Y


Не знаєте, як це запитати, але чи дійсно можна сказати про тенденції, що спостерігаються на сюжетах? Наприклад, чи корисність відповідності кожної тенденції пов'язана з тим, наскільки незалежними є кожен з прогнозів, чи щось подібне?
naught101

3
Чи існує метод перекладу одиниць залишку на горизонтальну та вертикальну осі в одиниці базових змінних?
Микола Г

Це така відмінна відповідь. Але чи є помилка друку у вашому першому абзаці (змінні предиктора)? Чи повинні вони бути X2 та X3?
detly

@detly Thanks, changed!
Silverfish

Silverfish, do you know the answer to @NicholasG question? Is there any way to make the residuals interpretable in terms of units of the X-variable?
Parseltongue

-1

is there anything that can really be said about the trends seen in the plots

Sure, their slopes are the regression coefficients from the original model (partial regression coefficients, all other predictors held constant)

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.