Я знаю, що мені щось не вистачає в моєму розумінні логістичної регресії, і я дуже вдячний за будь-яку допомогу.
Наскільки я розумію, логістична регресія передбачає, що ймовірність результату '1' за даними входів є лінійною комбінацією входів, переданих через функцію обернено-логістичної. Це є прикладом у наступному R-коді:
#create data:
x1 = rnorm(1000) # some continuous variables
x2 = rnorm(1000)
z = 1 + 2*x1 + 3*x2 # linear combination with a bias
pr = 1/(1+exp(-z)) # pass through an inv-logit function
y = pr > 0.5 # take as '1' if probability > 0.5
#now feed it to glm:
df = data.frame(y=y,x1=x1,x2=x2)
glm =glm( y~x1+x2,data=df,family="binomial")
і я отримую таке повідомлення про помилку:
Попереджувальні повідомлення: 1: glm.fit: алгоритм не збігся 2: glm.fit: встановлені ймовірності числово 0 або 1
Я працював з R певний час; достатньо знати, що, мабуть, я сам винен .. що тут відбувається?