Запитання з тегом «multicollinearity»

Ситуація, коли між змінними провісника є сильна лінійна залежність, так що їх кореляційна матриця стає (майже) сингулярною. Цей «поганий стан» ускладнює визначення унікальної ролі, яку грає кожен з прогнозів: виникають проблеми з оцінкою та збільшуються стандартні помилки. Одним із прикладів мультиколінеарності є двоваріантно дуже високі корельовані предиктори.

4
Як інтерпретувати криву виживання моделі Кокса?
Як ви інтерпретуєте криву виживання з пропорційною моделлю небезпеки Кокса? У цьому прикладі іграшки, припустимо, ми маємо коксову пропорційну модель небезпеки для ageзмінної kidneyданих та генеруємо криву виживання. library(survival) fit <- coxph(Surv(time, status)~age, data=kidney) plot(conf.int="none", survfit(fit)) grid() Наприклад, на час 200200200, яке твердження вірно? або обидва помиляються? Заява 1: у …

1
Можна стандартизувати
Я намагаюся інтерпретувати результати статті, де вони застосували багаторазову регресію для прогнозування різних результатів. Однакββ\beta's (стандартизовані коефіцієнти B, визначені як βх1=Бх1⋅S Dх1S Dуβx1=Bx1⋅SDx1SDy\beta_{x_1} = B_{x_1} \cdot \frac{\mathrm{SD}_{x_1}}{\mathrm{SD}_y} де уyy є залежною змінною і х1x1x_1 є прогнозом) повідомляється, схоже, не відповідає повідомленому R2R2R^2: Попри ββ\beta з -0,83, -0,29, -0,16, -0,43, 0,25 …

3
Набір некорельованих, але лінійно залежних змінних
Чи можливо мати набір змінних, які не співвідносяться, але лінійно залежать?KKK тобто іcor(xi,xj)=0cor(xi,xj)=0cor(x_i, x_j)=0∑Ki=1aixi=0∑i=1Kaixi=0 \sum_{i=1}^K a_ix_i=0 Якщо так, чи можете ви написати приклад? EDIT: З відповідей випливає, що це неможливо. Принаймні, можливо, що де - розрахунковий коефіцієнт кореляції, обчислений від вибірок змінних, а - змінна, некорельована з .P(|ρ^xi,xj−ρ^xi,v|<ϵ)P(|ρ^xi,xj−ρ^xi,v|<ϵ)\mathbb{P}(|\hat \rho_{x_i, x_j}-\hat …

1
Термін взаємодії з використанням ієрархічного регресійного аналізу центрированих змінних? На які змінні слід зосередитись?
Я провожу ієрархічний регресійний аналіз, і у мене є невеликі сумніви: Чи обчислюємо термін взаємодії, використовуючи центрировані змінні? Чи повинні ми зосереджувати ВСІ безперервні змінні у наборі даних, крім залежної змінної? Коли ми повинні реєструвати деякі змінні (оскільки їх sd набагато вище їх середнього), чи будемо ми тоді центрувати змінну, …

3
Перемикання знаків при додаванні ще однієї змінної в регресії та значно більших масштабів
Основна настройка: модель регресії: де C - вектор керуючих змінних.у= константа +β1х1+β2х2+β3х3+β4х4+ α C+ ϵy=constant+β1x1+β2x2+β3x3+β4x4+αC+ϵy = \text{constant} +\beta_1x_1+\beta_2x_2+\beta_3x_3+\beta_4x_4+\alpha C+\epsilon Мене цікавить і очікую, що та будуть негативними. Однак у моделі є проблема мультиколінеарності, коефіцієнт кореляції задається через, corr ( , 0,9345, corr ( , 0,1765, corr ( , 0,3019.ββ\betaβ1β1\beta_1β2β2\beta_2х1x1x_1х2) =x2)=x_2)=х1x1x_1х3) …

1
Множинна регресія з відсутньою змінною предиктора
Припустимо, нам надають набір даних форми (y,x1,x2,⋯,xn)(y,x1,x2,⋯,xn)(y,x_{1},x_{2},\cdots, x_{n}) і (y,x1,x2,⋯,xn−1)(y,x1,x2,⋯,xn−1)(y,x_{1},x_{2},\cdots, x_{n-1}). Нам дається завдання передбачитиyyy на основі значень xxx. Ми оцінюємо дві регресії, де: yy=f1(x1,⋯,xn−1,xn)=f2(x1,⋯,xn−1)(1)(2)(1)y=f1(x1,⋯,xn−1,xn)(2)y=f2(x1,⋯,xn−1) \begin{align} y &=f_{1}(x_{1},\cdots, x_{n-1}, x_{n}) \tag{1} \\ y &=f_{2}(x_{1},\cdots, x_{n-1}) \tag{2} \end{align} Ми також оцінюємо регресію, яка прогнозує значення xnxnx_{n} на основі значень (x1,⋯,xn−1)(x1,⋯,xn−1)(x_{1},\cdots, x_{n-1}), …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.