Отже, оскільки ваша модель лінійна, очікуваний mpg дорівнює лінійному предиктору, ви можете читати mpg прямо з лінійної шкали прогноктора.
Для кожної змінної ви знаходите її значення у відповідній шкалі. Наприклад, уявіть, що ми хотіли знайти передбачуваний mpg для автомобіля з wt=4, am=1, qsec=18
:
що дає передбачуваний mpg приблизно 18,94. Заміщення рівняння дає 18,95, тож це досить близько. (На практиці ви, мабуть, працюєте лише до найближчої цілої точки - і так ви отримаєте приблизно 2 цифри точності - "19 мпг" - поза, а не 3-4 фігури, як тут.)
Однією з головних переваг такої діаграми, на мій погляд, є те, що миттєво бачиш відносний вплив змін у різних змінних предиктора (IV) на відповідь (DV). Навіть коли діаграма не потрібна для будь-яких обчислень, вона може мати велике значення з точки зору просто відображення відносних ефектів змінних.
Подальше запитання з коментарів:
Чи працює це однаково для нелінійних або поліноміальних регресій?
У випадках, коли є нелінійним в деяких прогнозах, потрібні деякі незначні - і, мабуть, очевидні - модифікації. Уявіть, що у нас єу = Ь 0 + Ь х 1 + F ( х 2 )E(Y)y^=b0+bx1+f(x2)
де:
(a) є монотонним; абоf
(b) не є монотоннимf
В будь-якому випадку шкала для працює точно так, як було зазначено вище, але у випадку:x1
(а) шкала для не буде лінійною; наприклад, якщо є монотонним зменшенням, але (приблизно) квадратичним, у вас може бути щось подібне: фx2f
(b) немонотонна шкала для "зламається" у точці повороту і перевернеться. напрx2
- тут функція має мінімум десь біляx = 2,23f(x)x=2.23
Можливо, що у таких функцій є кілька точок повороту, де масштаб би ламався і перевертався в кілька разів - але лінія осі має лише дві сторони.
З номограмами типу точок це не представляє труднощів, оскільки можна переміщувати додаткові масштабні відрізки вгору або вниз (або, загалом, ортогонально до осі) трохи, поки не відбудеться перекриття.
(Більше однієї точки повороту може бути проблемою для номограм типу вирівнювання; одне рішення, показане в книзі Гаррелла, полягає в тому, щоб злегка змістити всі шкали від опорної лінії, на якій насправді прийнято положення значення.)
У випадку ГЛМ з нелінійною функцією зв’язку ваги працюють як вище, але шкала лінійного предиктора буде позначена нелінійною шкалою для , щось на зразок (а) вище.Y
Приклади всіх цих ситуацій можна знайти в регресійних стратегіях моделювання Гаррелла .
Всього пара бічних записок
Я вважаю за краще бачити дві шкали точок у верхній і нижній частині відповідного розділу; інакше важко точно «вишикуватися», тому що ви повинні здогадатися, що таке «вертикаль». Щось на зразок цього:
Однак, як я зауважую в коментарях, для останнього розділу діаграми (загальна кількість балів та лінійний прогноктор) можливо кращою альтернативою другої шкали точок буде просто мати пару шкал "назад-назад" (загальна кількість балів на одній сторона, лінійний предиктор з іншого), як це:
після цього ми уникаємо необхідності знати, що таке «вертикаль».
Маючи лише два безперервні прогнози та єдиний бінарний коефіцієнт, ми можемо легко побудувати більш традиційну номограму вирівнювання :
У цьому випадку ви просто знаходите значення wt
та qsec
значення на їх шкалі та з'єднуєте їх з рядком; там, де вони перетинають mpg
вісь, ми зчитуємо значення (тоді як am
змінна визначає, яку сторону mpg
осі ви читаєте). У такому простому випадку подібні номограми є швидшими та простішими у використанні, але їх можна не так легко узагальнити для багатьох прогнозів, де вони можуть стати непростими. Номограма у вашому запитанні (як це реалізовано в стратегії регресійного моделювання та в rms
пакеті на R) може додавати більше змінних без змін. Це може бути цілком перевагою при роботі із взаємодіями.