Відповіді:
Вам не обов’язково нічого робити. Цілком можливо, що передбачувач спрацює нормально. Навіть якщо предікторних екстраполюють до значень за межами діапазону, можливо , затискним передбачення в діапазоні (тобто, використання замість того , щоб у ) буде робити добре. Перехресне підтвердження моделі, щоб побачити, чи працює це.
Однак обмежений діапазон викликає можливість нелінійного зв’язку між залежною змінною ( ) та незалежними змінними ( x i ). Деякі додаткові показники цього включають:
Великий розкид залишкових значень , коли у знаходиться в середині свого діапазону, по порівнянні зі зміною залишків на обох кінцях діапазону.
Теоретичні причини конкретних нелінійних зв’язків.
Докази неправильної специфікації моделі (отримані звичайними способами).
Значення квадратичних чи високих порядків у .
Розглянемо нелінійне повторне вираження у випадку будь-якого з цих умов.
Існує багато способів повторного вираження для створення більш лінійних зв’язків з x i . Наприклад, будь-яку зростаючу функцію f, визначену на проміжку [ 0 , 70 ], можна "скласти", щоб створити симетричну функцію збільшення через y → f ( y ) - f ( 70 - y ) . Якщо f стає довільно великим і негативним, коли його аргумент наближається до 0 , складена версія f буде відображатись [ 0 , 70у всі реальні числа. Приклади таких функцій включають логарифм і будь-яку негативну силу. Використання логарифму еквівалентно "посиланню logit", рекомендованому @ user603. Інший спосіб - нехай є зворотним CDF будь-якого розподілу ймовірностей і визначить f ( y ) = G ( y / 70 ) . Використання нормального розподілу дає «пробіт» перетворення.
Один із способів використання сімей перетворень - експериментувати: спробувати ймовірне перетворення, здійснити швидку регресію перетвореного на х i та протестувати залишки: вони, здається, не залежать від передбачуваних значень y (гомосептичні та некорельовані ). Це ознаки лінійного зв’язку з незалежними змінними. Це також допомагає, якщо залишки перетворених назад прогнозованих значень мають тенденцію бути невеликими. Це вказує, що трансформація покращила придатність. Щоб протистояти наслідкам людей, що використовуються, використовуйте стійкі методи регресії, такі як ітеративно переоцінене найменше квадратів .
Важливо врахувати, чому ваші значення обмежені в діапазоні 0-70. Наприклад, якщо вони є кількістю правильних відповідей на тесті на 70 запитань, то слід розглянути моделі змінних "кількість успіхів", наприклад, передисперсну біноміальну регресію. Інші причини можуть привести вас до інших рішень.
Перетворення даних: змінити масштаб даних, щоб вони лежали в і моделювати їх за допомогою glm-моделі з посиланням logit.
Редагувати: Коли ви повторно масштабуєте вектор (тобто розділяєте всі елементи на найбільший запис), як правило, перед тим, як зробити це, екраніруйте (очні яблука) для залишків.
ОНОВЛЕННЯ
Assuming you have access to R, i would carry the modeling part with a robust glm routine, see in package .