Запитання з тегом «multicollinearity»

Ситуація, коли між змінними провісника є сильна лінійна залежність, так що їх кореляційна матриця стає (майже) сингулярною. Цей «поганий стан» ускладнює визначення унікальної ролі, яку грає кожен з прогнозів: виникають проблеми з оцінкою та збільшуються стандартні помилки. Одним із прикладів мультиколінеарності є двоваріантно дуже високі корельовані предиктори.

5
Чи стандартизація незалежних змінних зменшує колінеарність?
Я натрапив на дуже хороший текст про Bayes / MCMC. ІТ передбачає, що стандартизація ваших незалежних змінних зробить алгоритм MCMC (Metropolis) більш ефективним, але також може зменшити (багато) колінеарність. Чи може це бути правдою? Це щось, що я повинен робити як стандарт . (Вибачте). Kruschke 2011, Doing Bayesian Analysis Data. …

1
Інтерпретація пропорцій, що дорівнюють одиниці як незалежні змінні в лінійній регресії
Мені знайоме поняття категоричних змінних та відповідне кодування фіктивних змінних, що дозволяє нам підходити до одного рівня як базового рівня, щоб уникнути колінеарності. Мені також знайоме, як інтерпретувати оцінки параметрів з таких моделей: Передбачувана зміна результату для заданого відповідного рівня категоричного прогноктора стосовно базової категорії. Я не впевнений у тому, …

3
Що таке приклад ідеальної мультиколінеарності?
Що таке приклад ідеальної колінеарності з точки зору дизайнерської матриці ?XXX Я хотів би приклад, коли неможливо оцінити, оскільки не є зворотним.β^=(X′X)−1X′Yβ^=(X′X)−1X′Y\hat \beta = (X'X)^{-1}X'Y(X′X)(X′X)(X'X)

2
Варіантно-коваріаційна інтерпретація матриці
Припустимо, у нас є лінійна модель Model1і vcov(Model1)дає таку матрицю: (Intercept) latitude sea.distance altitude (Intercept) 28.898100 -23.6439000 -34.1523000 0.50790600 latitude -23.643900 19.7032500 28.4602500 -0.42471450 sea.distance -34.152300 28.4602500 42.4714500 -0.62612550 altitude 0.507906 -0.4247145 -0.6261255 0.00928242 Для цього прикладу, що насправді відображає ця матриця? Які припущення ми можемо сміливо зробити для нашої …

1
Чи є проблема з мультиколінеарністю та регресією сплайнів?
При використанні природних (тобто обмежених) кубічних сплайнів базові функції, створені вкрай колінеарними, і при використанні в регресії, здається, створюють дуже високу статистику VIF (коефіцієнта дисперсії), що сигналізує про мультиколінеарність. Коли ми розглядаємо випадок моделі для прогнозування, це питання? Схоже, це завжди буде так через характер конструкції шпонки. Ось приклад в …

2
Як почати будувати регресійну модель, коли найбільш сильно асоційований предиктор - двійковий
У мене є набір даних, що містить 365 спостереження за трьома змінними, а саме pm, tempі rain. Тепер я хочу перевірити поведінку pmу відповідь на зміни інших двох змінних. Мої змінні: pm10 = Відповідь (залежно) temp = предиктор (незалежний) rain = предиктор (незалежний) Далі наведена кореляційна матриця для моїх даних: …

3
У чому переваги різних підходів до виявлення колінеарності?
Я хочу виявити, чи колінеарність є проблемою в моїй регресії OLS. Я розумію, що коефіцієнти інфляції дисперсії та індекс стану є двома загальноприйнятими заходами, але мені важко знайти щось певне щодо достоїнств кожного підходу чи таких, якими мають бути оцінки. Видатне джерело, яке вказує, який підхід робити та / або …

5
Що робити з колінеарними змінними
Відмова: Це для домашнього завдання. Я намагаюся придумати найкращу модель для ціни на алмази, залежно від кількох змінних, і, здається, поки що у мене досить гарна модель. Однак я зіткнувся з двома змінними, які, очевидно, колінеарні: >with(diamonds, cor(data.frame(Table, Depth, Carat.Weight))) Table Depth Carat.Weight Table 1.00000000 -0.41035485 0.05237998 Depth -0.41035485 1.00000000 …

2
Колінеарність між категоричними змінними
Є багато про колінеарність щодо безперервних прогнозів, але не так багато, що я можу знайти на категоричних прогнозах. У мене дані цього типу проілюстровані нижче. Перший фактор - генетична змінна (кількість алелів), другий - категорія захворювання. Очевидно, що гени передують захворюванню і є фактором прояву симптомів, що призводять до діагностики. …

1
Посилання на суму та різницю сильно корельованих змінних майже не співвідносяться
У статті, яку я написав, я моделюю випадкові величини і а не і Y, щоб ефективно усунути проблеми, які виникають, коли X і Y сильно співвідносяться і мають однакову дисперсію (як у моїй програмі). Судді хочуть, щоб я дав посилання. Я міг би це легко довести, але, будучи журналом програми, …

1
Чи чутливий векторний апарат підтримки до співвідношення між атрибутами?
Я хотів би навчити SVM для класифікації справ (TRUE / FALSE) на основі 20 атрибутів. Я знаю, що деякі з цих ознак сильно співвідносяться. Тому моє запитання: чи SVM чутливий до співвідношення чи надмірності між ознаками? Будь-яка довідка?

1
Варіаційний коефіцієнт інфляції для узагальнених моделей присадки
У звичайному обчисленні VIF для лінійної регресії кожна незалежна / пояснювальна змінна трактується як залежна змінна в звичайній регресії найменших квадратів. тобтоXjXjX_j Xj=β0+∑i=1,i≠jnβiXiXj=β0+∑i=1,i≠jnβiXi X_j = \beta_0 + \sum_{i=1, i \neq j}^n \beta_i X_i Значення зберігаються для кожної з регресій, а VIF визначається заR2R2R^2nnn VIFj=11−R2jVIFj=11−Rj2 VIF_j = \frac{1}{1-R^2_j} для певної пояснювальної …

3
Лінійна залежність між пояснювальними змінними при множинній регресії
Я читав розділ " Аналіз даних та графіки" з кількома регресіями, використовуючи R: Приклад, заснований на прикладі, і трохи розгубився, дізнавшись, що він рекомендує перевірити наявність лінійних взаємозв'язків між пояснювальними змінними (використовуючи розсіювач) і, якщо таких немає " т будь-, перетворюючи їх таким чином , вони дійсно стають більш лінійно …

2
Чи мультиколінеарність неявна категоричним змінним?
Я зауважив, що повозився з багатоваріантною регресійною моделлю, був невеликий, але помітний ефект мультиколінеарності, виміряний коефіцієнтами дисперсії, в межах категорії категоріальної змінної (звичайно, виключаючи референтну категорію). Наприклад, скажімо, у нас є набір даних із суцільною змінною y та однією номінальною категоріальною змінною x, яка має k можливих взаємовиключних значень. Ми …

3
Визначення статистичної значущості коефіцієнта лінійної регресії за наявності мультиколінеарності
Припустимо, у мене є маса міст з різною чисельністю населення, і я хотів побачити, чи існує позитивна лінійна залежність між кількістю магазинів алкогольних напоїв у місті та кількістю ДУІ. Де я визначаю, чи є ця залежність значною чи ні, спираючись на t-тест розрахункового коефіцієнта регресії. Тепер явно поп. розмір міста …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.