В основному наївний класифікатор Байєса не є лінійним, але якщо ймовірність факторів походить із експоненціальних родин , наївний класифікатор Байєса відповідає лінійному класифікатору у певному просторі ознак. Ось як це бачити.р ( хi∣ в )
Ви можете написати будь-який наївний класифікатор Байєса як *
p(c=1∣x)=σ(∑ilogp(xi∣c=1)p(xi∣c=0)+logp(c=1)p(c=0)),
де - логістична функція . Якщо p ( x i ∣ c ) походить із експоненціальної родини, ми можемо записати це якσp(xi∣c)
p(xi∣c)=hi(xi)exp(u⊤icϕi(xi)−Ai(uic)),
і отже
p(c=1∣x)=σ(∑iw⊤iϕi(xi)+b),
де
wib=ui1−ui0,=logp(c=1)p(c=0)−∑i(Ai(ui1)−Ai(ui0)).
Зауважимо, що це схоже на логістичну регресію - лінійний класифікатор - у просторі функцій, визначеному . Для більш ніж двох класів ми аналогічно отримуємо багаточленну логістичну (або софтмакс) регресію .ϕi
Якщо - гауссова, тоді ϕ i ( x i ) = ( x i , x 2 i ), і ми повинні мати
w i 1p(xi∣c)ϕi(xi)=(xi,x2i)
wi1wi2bi=σ−21μ1−σ−20μ0,=2σ−20−2σ−21,=logσ0−logσ1,
припустимо, що .p(c=1)=p(c=0)=12
* Ось як отримати цей результат:
p(c=1∣x)=p(x∣c=1)p(c=1)p(x∣c=1)p(c=1)+p(x∣c=0)p(c=0)=11+p(x∣c=0)p(c=0)p(x∣c=1)p(c=1)=11+exp(−logp(x∣c=1)p(c=1)p(x∣c=0)p(c=0))=σ(∑ilogp(xi∣c=1)p(xi∣c=0)+logp(c=1)p(c=0))