У машинному навчанні люди говорять про об'єктивну функцію, функцію витрат, функцію втрат. Це просто різні назви одного і того ж? Коли їх використовувати? Якщо вони не завжди посилаються на одне й те саме, які відмінності?
У машинному навчанні люди говорять про об'єктивну функцію, функцію витрат, функцію втрат. Це просто різні назви одного і того ж? Коли їх використовувати? Якщо вони не завжди посилаються на одне й те саме, які відмінності?
Відповіді:
Це не дуже строгі умови, і вони дуже пов'язані. Однак:
Короткий огляд, я б сказав, що:
Функція втрат - це частина функції витрат, яка є типом об'єктивної функції.
За словами професора Ендрю Нг (див. Слайди на стор. 11),
Функція h (X) представляє вашу гіпотезу. Для фіксованих параметрів підгонки тета - це функція функції X. Я б сказав, що це також можна назвати цільовою функцією.
Функція витрат J - це функція theta параметрів підгонки. J = J (тета).
Відповідно до підручника Hastie et al. "Елементи статистичного навчання" , на с.37:
"Ми шукаємо функцію f (X) для прогнозування Y заданих значень входу X." [...] функція втрати L (Y, f (X)) "є функцією для покарання помилок у передбаченні",
Тож здається, що "функція втрати" є дещо більш загальним терміном, ніж "функція витрат". Якщо ви шукаєте "втрати" в цьому PDF-файлі, я думаю, що вони використовують "функцію витрат" та "функцію втрати" дещо синонімічно.
Справді, с. 502
"Ситуація [в кластері] дещо схожа на конкретизацію функції збитків або витрат у задачах передбачення (контрольоване навчання)".
Можливо, ці терміни існують, оскільки вони розвивалися незалежно в різних академічних спільнотах. "Об'єктивна функція" - це старий термін, що використовується в дослідженні операцій та інженерній математиці. "Функція втрати" може бути більш вживаною серед статистиків. Але я спекулюю тут.
За словами Ендрю Н.Г.,
"Нарешті, функція втрат була визначена стосовно єдиного прикладу навчання. Він вимірює, наскільки добре ви працюєте на одному прикладі навчання. Зараз я буду визначати щось, що називається функцією витрат, яка визначає, наскільки ви добре виконуючи цілий навчальний набір. Таким чином, функція витрат J, яка застосовується до ваших параметрів W і B, буде середньою з одним із m суми функції втрат, застосованої до кожного з навчальних прикладів, і повернути. "
Із розділу 4.3 в "Поглибленому навчанні" - Йен Гудфлоу, Йошуа Бенджо, Аарон Курвіль http://www.deeplearningbook.org/
"Функція, яку ми хочемо мінімізувати або максимізувати, називається цільовою функцією або критерієм. Коли ми її мінімізуємо, ми можемо також назвати її функцією витрат, функцією втрати або функцією помилки. У цій книзі ми використовуємо ці терміни взаємозамінно, хоча деякі публікації машинного навчання надають особливого значення деяким із цих термінів ".
Принаймні, у цій книзі втрати та вартість однакові.
Щоб дати вам коротку відповідь, на мою думку, вони є синонімами. Однак функція витрат більше використовується в задачі оптимізації, а функція втрат використовується при оцінці параметрів.
Терміни вартість і втрати функції є синонімами, деякі люди також називають це функцією помилок. Більш загальним сценарієм є спочатку визначення цільової функції, яку ми хочемо оптимізувати. Ця об'єктивна функція могла би бути
Насправді, щоб бути простим Якщо у вас є такі дані тренувань, як це (x (1), y (1)), (x (2), y (2)),. . . (x (m), y (m)) Ми використовуємо функцію втрат L (ycap, y), щоб знайти втрати між ycap та y одного навчального набору. Якщо ми хочемо знайти втрати між ycap та y цілого навчального набору, ми використовуємо функція витрат.
Примітка: - ycap означає вихід з нашої моделі, а y означає очікуваний вихід
Примітка: - Кредит йде на Ендрю з ресурсу: нейронна мережа курсу та глибоке навчання
Функція втрати обчислює помилку для одного прикладу навчання, тоді як функція витрат - це середнє значення функцій втрат усього навчального набору.