Хтось знає, як опрацювати, чи бали 7, 16 та 29 є впливовими пунктами чи ні? Я десь читав, що оскільки відстань Кука нижча за 1, вони не є. Чи правий я?
Хтось знає, як опрацювати, чи бали 7, 16 та 29 є впливовими пунктами чи ні? Я десь читав, що оскільки відстань Кука нижча за 1, вони не є. Чи правий я?
Відповіді:
Деякі тексти говорять про те, що точки, для яких відстань Кука перевищує 1, слід вважати впливовими. Інші тексти дають поріг або , де - кількість спостережень, а - кількість пояснювальних змінних. У вашому випадку остання формула повинна мати поріг близько 0,1.4 / ( N - k - 1 ) N k
Джон Фокс (1) у своїй брошурі про регресійну діагностику є досить обережним, коли йдеться про визначення числових порогів. Він радить використовувати графіку та більш детально вивчити точки зі "значеннями D, які значно перевищують інші". За словами Фокса, пороги слід просто використовувати для покращення графічних дисплеїв.
У вашому випадку спостереження 7 та 16 можна вважати впливовими. Ну, я хоч би придивився до них уважніше. Спостереження 29 суттєво не відрізняється від кількох інших спостережень.
(1) Лисиця, Джон. (1991). Регресійна діагностика: вступ . Публікації шавлії.
Тут є ще один момент. У спостережувальних дослідженнях часто важко провести рівномірну вибірку по всьому простору прогнозів, і у вас може бути лише кілька балів у даній області. Такі точки можуть відрізнятися від решти. Маючи декілька виразних випадків, можна викликати неприємні сумніви, але заслуговуйте значної думки перед тим, як звільнити людей, що втратили свій досвід. Можливо, законно існує взаємодія між передбачувачами, або система може зміститися по-різному, коли значення предиктора стануть крайніми. Крім того, вони можуть допомогти вам розв'язати наслідки колінарних прогнозів. Впливові моменти можуть стати благом у маскуванні.