Я думаю про проблему, яка полягає в тому, щоб передбачити вхід (витрати) клієнта за допомогою лінійної регресії.
Я розглядаю, які функції використовувати як вхідні дані, і цікаво, чи було б добре використовувати перцентил змінної як вхідні дані.
Наприклад, я міг використовувати дохід компаній як вкладення. Мені цікаво, чи можу я замість цього використати процентний дохід компанії.
Іншим прикладом може бути категоричний галузевий класифікатор (NAICS) - якби я дивився на середні витрати за кодом NAICS, а потім присвоював кожен код NAICS "Percentile NAICS", чи це була б вагома пояснювальна змінна, яку я міг би використовувати?
Просто цікаво, чи є якісь проблеми, про які слід пам’ятати при використанні відсотків? Це в чомусь еквівалентно типу масштабування функцій?