Belsley, Kuh і Welsch - це текст, на який слід звернутися до такого питання. Вони включають широке обговорення старшої діагностики у розділі «Історична перспектива». Щодо VIF вони пишуть
... Якщо ми припускаємо , що дані були центрованими і масштабуються , щоб мати одиничну довжину, кореляційна матриця просто . ...XRX′X
Ми розглядаємо . Діагональні елементи , часто називають коефіцієнтами інфляції дисперсії , а їх діагностичне значення випливає із співвідношення де - коефіцієнт множинної кореляції регресуючи на інших пояснювальних змінних. Очевидно, що високий VIF вказує на поблизу єдності, а значить, вказує на колінеарність. Таким чином, цей захід є деяким вживанням як загальна ознака колінеарності. Його слабкі місця, як і уR−1=(X′X)−1R−1riiVIFi
VIFi=11−R2i
R2iXiR2iR, полягає у його нездатності розрізнити декілька співіснуючих близьких залежностей та у відсутності змістовної межі для розрізнення значень VIF, які можна вважати високими, та тих, які можна вважати низькими.
Замість аналізує (або ), BKW пропонує ретельне, контрольоване дослідження сингулярного розкладання . Вони мотивують це, демонструючи , що відношення найбільшого до найдрібніших сингулярних значень є числом обумовленості з і покажуть , як число обумовленості забезпечує (іноді жорстке) оцінки на поширенні обчислювальних помилок при розрахунку оцінок регресії. Вони продовжують спробувати приблизну декомпозицію відхилень оцінок параметрів на компоненти, пов'язані з сингулярними значеннями. Сила цього розкладання полягає в його здатності (в багатьох випадках) розкривати природуRR−1XXβ^i колінеарності, а не просто вказівки на її наявність.
Усі, хто створив регресійні моделі із сотнями змінних, оцінять цю особливість! Одне програмне забезпечення говорить «ваші дані колінеарні, я не можу продовжувати» або навіть сказати «ваші дані колінеарні, я викидаю такі змінні». Це взагалі набагато корисніше, щоб можна було сказати "група змінних викликає нестабільності в обчисленнях: подивіться, яку з цих змінних можна зробити без чи врахувати виконання аналізу основних компонентів для зменшення їх кількості ".Xi1,…,Xik
Зрештою, BKW рекомендує діагностувати колінеарність за допомогою
... наступна подвійна умова:
- Окреме значення, яке оцінюється як високий індекс стану, і яке пов'язане з
- Високі співвідношення дисперсії та дисперсії для двох або більше оцінених дисперсій коефіцієнта регресії.
Кількість індексів умов, які вважаються великими (скажімо, більшими, ніж ) у (1), визначає кількість близьких залежностей серед стовпців матриці даних , а величини цих високих показників стану забезпечують міру їх відносної «герметичності». " Крім того, визначення (2) великої дисперсійної декомпозиції (скажімо, більше ), пов'язаного з кожним високим показником умови, ідентифікує ті змінні, які беруть участь у відповідній близькій залежності, та величину цих пропорцій у поєднанні з високою індекс стану передбачає міру ступеня, до якої відповідна оцінка регресії була деградована наявністю колінеарності.30X0.5