Що означає "розподіляти параметри між функціями та класами"


20

Під час читання цього документу є рядок, в якому сказано, що "лінійні класифікатори не ділять параметри між функціями та класами". У чому сенс цього твердження? Чи означає це, що лінійні класифікатори, такі як логістична регресія, потребують функцій, які взаємно незалежні?

Відповіді:


22

Я спробую відповісти на це питання за допомогою логістичної регресії , одного з найпростіших лінійних класифікаторів.

Найпростіший випадок логістичної регресії - це якщо у нас є завдання бінарної класифікації ( і лише одна особливість введення ( ). У цьому випадку результатом логістичної регресії буде:y{0,1})xR

y^=σ(wx+b)
де w і b - обидва скаляри . Вихід моделі y^[0,1] відповідає ймовірності того, що x буде класом 1 .

Ми спробуємо розбити фразу "лінійні класифікатори не ділять параметри між функціями та класами" на дві частини. Ми розглянемо окремі випадки декількох функцій та декількох класів, щоб перевірити, чи логістична регресія розділяє параметри для будь-яких цих завдань:

Чи ділять лінійні класифікатори параметри серед функцій?

У цьому випадку для кожного прикладу y - скаляр, який приймає двійкові значення (як і раніше), а x - вектор довжини N (де N - кількість ознак). Тут вихід - це лінійна комбінація вхідних функцій (тобто зважена сума цих функцій плюс ухили).

x w N xw w i x i

y^=σ(iN(wixi)+b)orσ(wx+b)
, де і є вектори довжини . Продукт створює скаляр. Як видно зверху, для кожної вхідної функції є окрема вага і ці ваги не залежать від усіх засобів. З цього можна зробити висновок про відсутність спільного використання параметрів між функціями .xwNxw wixi

Чи ділять лінійні класифікатори параметри між класами?

У цьому випадку - скалярний, проте - вектор довжини (де - кількість класів). Для вирішення цього питання логістична регресія по суті створює окремий вихід для кожного з класів. Кожен вихід є скалярним і відповідає ймовірності що належить до класу .y M M y j M y j[ 0 , 1 ] x jxyMMyjMyj[0,1]xj

y^=wx+b,wherey^=y^1,y^2,...,yM

Найпростіший спосіб думати про це , як простих незалежних логістичних регресій кожна з виходом:M

y^j=σ(wjx+bj)

З вищесказаного очевидно, що між різними класами немає ваг .

багатофункціональність та багатокласність :

Комбінуючи два вищезазначені випадки, ми можемо нарешті дійти до найзагальнішого випадку з кількох функцій та кількох класів:

y^=σ(Wx+b)
де - вектор з розміром , - вектор з розміром , - вектор з розміром а - матриця розміром .y^MxNbMW(N×M)

У будь-якому випадку лінійні класифікатори не поділяють жодних параметрів серед функцій чи класів .

Щоб відповісти на ваше друге запитання, лінійні класифікатори мають основне припущення, що функції повинні бути незалежними , проте це не те, що автор статті мав намір сказати.


1
Приємне пояснення. :)
joydeep bhattacharjee
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.