Перетворюючи змінні, чи потрібно вам використовувати одне й те саме перетворення? Наприклад, чи можу я вибрати і вибрати різні змінені змінні, як у:
Нехай, - вік, тривалість роботи, тривалість проживання та дохід.
Y = B1*sqrt(x1) + B2*-1/(x2) + B3*log(x3)
Або ви повинні бути узгоджені зі своїми перетвореннями і використовувати все те саме? Як і в:
Y = B1*log(x1) + B2*log(x2) + B3*log(x3)
Я розумію, що метою трансформації є вирішення проблеми нормальності. Переглядаючи гістограми кожної змінної, ми можемо побачити, що вони представляють дуже різні розподіли, що призведе до того, що потрібні перетворення різні за змінною ознакою.
## R Code
df <- read.spss(file="http://www.bertelsen.ca/R/logistic-regression.sav",
use.value.labels=T, to.data.frame=T)
hist(df[1:7])
## R Code
plot(df[1:7])