Я роблю курс машинного навчання Стенфорда на Coursera.
У главі з логістичної регресії функція витрат така:
Я намагався отримати похідну від функції витрат, але отримав щось зовсім інше.
Як отримується похідна?
Які є посередницькими кроками?
Я роблю курс машинного навчання Стенфорда на Coursera.
У главі з логістичної регресії функція витрат така:
Я намагався отримати похідну від функції витрат, але отримав щось зовсім інше.
Як отримується похідна?
Які є посередницькими кроками?
Відповіді:
Адаптовано з конспектів курсу, які я не бачу доступними (включаючи це виведення) за межами конспектів, внесених студентами на сторінці курсу «Курсове машинне навчання Ендрю Нґ» Ендрю Нґ .
У подальшому, суперскрипт позначає індивідуальні вимірювання або навчальні "приклади".
Похідна від сигмоїдної функції є
Щоб уникнути враження надмірної складності справи, давайте просто побачимо структуру рішення.
Зі спрощенням і деяким зловживанням позначенням, нехай є терміном у сумі , а є функцією :
Ми можемо використовувати правило ланцюга: і вирішити його по одному одна ( і - константи).
Нарешті, .
Об'єднання результатів все разом дає шуканий вираз: Надія, яка допомагає.
Заслуга цієї відповіді належить Антоні Парелладі з коментарів, які, на мою думку, заслуговують на більш помітне місце на цій сторінці (як це допомагало мені, коли багато інших відповідей не мали). Крім того, це не повна деривація, а більше чітке твердження . (Для повного виведення див. Інші відповіді).
де
Також реалізація Python для тих, хто хоче обчислити градієнт відносно .
import numpy
def sig(z):
return 1/(1+np.e**-(z))
def compute_grad(X, y, w):
"""
Compute gradient of cross entropy function with sigmoidal probabilities
Args:
X (numpy.ndarray): examples. Individuals in rows, features in columns
y (numpy.ndarray): labels. Vector corresponding to rows in X
w (numpy.ndarray): weight vector
Returns:
numpy.ndarray
"""
m = X.shape[0]
Z = w.dot(X.T)
A = sig(Z)
return (-1/ m) * (X.T * (A - y)).sum(axis=1)
Для тих із нас, хто не настільки сильний в обчисленні, але хотів би пограти з коригуванням функції витрат і потрібно знайти спосіб розрахунку похідних ... короткий шлях до повторного вивчення числення - це онлайн-інструмент для автоматичного надання виведення, з покроковими поясненнями правила.