Це питання стосовно практики чи методу, за яким дотримуються деякі мої колеги. Створюючи логістичну регресійну модель, я бачив, як люди замінюють категоричні змінні (або суцільні змінні, котрі поширюються) на відповідну Вагу доказів (WoE). Це нібито робиться для встановлення монотонного зв'язку між регресором та залежною змінною. Наскільки я розумію, щойно модель зроблена, змінні рівняння НЕ є змінними в наборі даних. Швидше, змінні в рівнянні тепер набувають свого роду важливості або ваги змінних при поділі залежної змінної !
Моє запитання: як ми інтерпретуємо модель або коефіцієнти моделі? Наприклад для наступного рівняння:
можна сказати, що є відносним збільшенням коефіцієнта непарності для збільшення на 1 одиницю змінної x 1 .
Але якщо змінна буде замінена її WoE, то інтерпретація буде змінена на: відносне збільшення коефіцієнта непарності на 1 одиницю збільшення ВАЖЛИВОСТІ / ВАГИ змінної
Я бачив цю практику в Інтернеті, але ніде не знайшов відповіді на це питання. Саме посилання цієї спільноти пов'язане із дещо подібним запитом, де хтось написав:
WoE відображає лінійний зв'язок із природним логарифмом коефіцієнта шансів, який є залежною змінною в логістичній регресії. Тому питання про неправильне визначення моделі не виникає при логістичній регресії, коли ми використовуємо WoE замість фактичних значень змінної.
Але я досі не отримую пояснень. Будь ласка, допоможіть мені зрозуміти, чого я пропускаю.