Запитання з тегом «multicollinearity»

Ситуація, коли між змінними провісника є сильна лінійна залежність, так що їх кореляційна матриця стає (майже) сингулярною. Цей «поганий стан» ускладнює визначення унікальної ролі, яку грає кожен з прогнозів: виникають проблеми з оцінкою та збільшуються стандартні помилки. Одним із прикладів мультиколінеарності є двоваріантно дуже високі корельовані предиктори.

9
Чи існує інтуїтивне пояснення, чому мультиколінеарність - це проблема лінійної регресії?
У вікі обговорюються проблеми, які виникають, коли мультиколінеарність є проблемою лінійної регресії. Основна проблема полягає в тому, що мультиколінеарність призводить до нестабільних оцінок параметрів, що ускладнює оцінку впливу незалежних змінних на залежні змінні. Я розумію технічні причини, що стоять перед проблемами (можливо, не вдасться перевернути , неправильно обумовлені тощо), але …

9
Чому можна отримати значну F статистику (p <.001), але несуттєві регресорні t-тести?
Чому в декількох лінійних регресіях, чому можна мати дуже значну статистику F (p &lt;.001), але мати дуже високі значення p у всіх тестах регресора? У моїй моделі є 10 регресорів. Один має р-значення 0,1, а решта вище 0,9 Для вирішення цієї проблеми див. Подальше запитання .

1
Яке співвідношення робить матрицю сингулярною та які наслідки сингулярності чи близької сингулярності?
Я роблю кілька обчислень на різних матрицях (головним чином у логістичній регресії), і я часто отримую помилку "Матриця є сингулярною", де мені потрібно повернутися назад і видалити корельовані змінні. Моє запитання тут - що б ви вважали "сильно" корельованою матрицею? Чи є порогове значення кореляції для відображення цього слова? Як …

3
Який ефект має співвіднесення предикторів у моделі множинної регресії?
У моєму класі лінійних моделей я дізнався, що якщо два предиктори співвідносяться і обидва будуть включені в модель, один буде незначним. Наприклад, припустимо, що розмір будинку та кількість спалень співвідносяться. При прогнозуванні вартості будинку з використанням цих двох прогнозів один з них може бути відхилений, оскільки вони обидва надають багато …

6
Чому мультиколінеарність не перевіряється в сучасній статистиці / машинному навчанні
У традиційній статистиці, будуючи модель, ми перевіряємо наявність мультиколінеарності за допомогою таких методів, як оцінки коефіцієнта дисперсії дисперсії (VIF), але в машинному навчанні ми замість цього використовуємо регуляризацію для вибору особливостей і, здається, не перевіряємо, чи співвідносяться функції зовсім. Чому ми це робимо?

2
Чи не будуть сильно корельовані змінні у випадковій лісовій деформації точності та вибору ознак?
На моє розуміння, сильно корельовані змінні не спричинять проблем мультиколінеарності у випадковій лісовій моделі (Будь ласка, виправте мене, якщо я помиляюся). Однак, з іншого боку, якщо у мене буде занадто багато змінних, що містять подібну інформацію, чи буде вага цієї моделі занадто великою, ніж інші? Наприклад, є два набори інформації …

3
Який коефіцієнт інфляції дисперсії я повинен використовувати:
Я намагаюся інтерпретувати дисперсії коефіцієнтів інфляції з використанням vifфункції в пакеті R car. Функція друкує як узагальнений і . Відповідно до файлу довідки , це останнє значенняVIFVIF\text{VIF}GVIF1/(2⋅df)GVIF1/(2⋅df)\text{GVIF}^{1/(2\cdot\text{df})} Для коригування розмірності довірчого еліпсоїда функція також друкує GVIF ^ [1 / (2 * df)], де df - ступені свободи, пов'язані з терміном. …

3
Як боротися з мультиколінеарністю при виконанні варіативного вибору?
У мене є набір даних з 9 безперервними незалежними змінними. Я намагаюся вибрати серед цих змінних , щоб відповідати моделі до одного відсотка ( в залежності) змінної Score. На жаль, я знаю, що між декількома змінними буде серйозна колінеарність. Я намагався використовувати stepAIC()функцію в R для вибору змінної, але цей …

3
Як визначити різницю між лінійними та нелінійними моделями регресії?
Я читав наступне посилання на нелінійну регресію SAS нелінійної . Моє розуміння з прочитання першого розділу "Нелінійна регресія проти лінійної регресії" полягала в тому, що рівняння нижче є фактично лінійною регресією, чи правильно це? Якщо так, чому? y=b1x3+b2x2+b3x+cy=b1x3+b2x2+b3x+cy = b_1x^3 + b_2x^2 + b_3x + c Чи я також повинен …

2
Діагностика колінеарності проблематична лише тоді, коли включений термін взаємодії
Я провів регресію в американських графствах і перевіряв наявність колінеарності у своїх "незалежних" змінних. Регресійна діагностика Belsley, Kuh та Welsch пропонує переглянути показник коефіцієнта стану та дисперсійного коефіцієнта: library(perturb) ## colldiag(, scale=TRUE) for model with interaction Condition Index Variance Decomposition Proportions (Intercept) inc09_10k unins09 sqmi_log pop10_perSqmi_log phys_per100k nppa_per100k black10_pct hisp10_pct …

5
Як перевірити та уникнути мультиколінеарності в змішаній лінійній моделі?
В даний час я використовую кілька лінійних моделей зі змішаним ефектом. Я використовую пакет "lme4" в Р. Мої моделі мають форму: model &lt;- lmer(response ~ predictor1 + predictor2 + (1 | random effect)) Перш ніж запускати свої моделі, я перевірив, чи можлива мультиколінеарність між предикторами. Я зробив це: Складіть кадр …

2
Чи PCA нестабільний при мультиколінеарності?
Я знаю, що в регресійній ситуації, якщо у вас є набір сильно корельованих змінних, це зазвичай "погано" через нестабільність оцінених коефіцієнтів (дисперсія йде в бік нескінченності, оскільки детермінанта йде до нуля). Моє запитання - чи зберігається ця «поганість» у ситуації з УПС. Чи стають коефіцієнти / навантаження / ваги / …


1
Чи є причина віддати перевагу конкретній мірі мультиколінеарності?
Працюючи з багатьма вхідними змінними, ми часто стурбовані мультиколінеарністю . Існує ряд заходів мультиколінеарності, які використовуються для виявлення, продумування та / або спілкування мультиколінеарності. Деякі поширені рекомендації: Множинний для конкретної змінної R2jRj2R^2_j Допуск для певної змінної 1 - R2j1-Rj21-R^2_j Коефіцієнт інфляції дисперсії для певної змінної VIF = 1толерантністьVIF=1толерантність\text{VIF}=\frac{1}{\text{tolerance}} Номер умови …

1
Як боротися з високою кореляцією серед прогнозів при множинній регресії?
Я знайшов посилання в статті, яка виглядає так: За даними Tabachnick &amp; Fidell (1996), незалежні змінні з двоваріантною кореляцією більше, ніж 70, не повинні включатись у багаторазовий регресійний аналіз. Проблема: Я використовував у дизайні множинних регресій 3 корельовані змінні&gt; .80, VIF з приблизно .2 - .3, толерантність ~ 4- 5. …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.