Чим відрізняється функція втрати від функції прийняття рішень?


Відповіді:


45

Функція прийняття рішення - це функція, яка приймає набір даних як вхідний дані і дає рішення як вихід. Яким може бути рішення, залежить від проблеми. Приклади включають:

  • Проблеми з оцінкою : "рішення" - це оцінка.
  • Проблеми тестування гіпотез: рішення полягає у відхиленні чи не відхиленні нульової гіпотези.
  • Проблеми з класифікацією: рішення полягає в тому, щоб класифікувати нове спостереження (або спостереження) на категорію.
  • Проблеми вибору моделі: рішення полягає у виборі однієї з кандидатських моделей.

Зазвичай існує нескінченна кількість функцій прийняття рішення щодо проблеми. Якщо нас, наприклад, цікавить оцінка висоти шведських самців на основі десяти спостережень , ми можемо використовувати будь-яку з наступних функцій рішення :x=(x1,x2,,x10)d(x)

  • Вибірка означає: .d(x)=110i=110xi
  • Медіана вибірки:d(x)=median(x)
  • Середнє геометричне значення вибірки:d(x)=x1x1010
  • Функція, яка завжди повертає 1: , незалежно від значення . Дурне, так, але це все-таки дійсна функція прийняття рішення.d(x)=1x

Як тоді ми можемо визначити, яку з цих функцій прийняття рішення використовувати? Один із способів - використовувати функцію збитків , яка описує втрати (або вартість), пов'язані з усіма можливими рішеннями. Різні функції прийняття рішень, як правило, призводять до помилок різного типу. Функція втрати вказує нам на те, який тип помилок нас би турбує більше. Найкраща функція рішення - це функція, яка приносить найменші очікувані втрати . Що мається на увазі під очікуваними втратами, залежить від налаштування (зокрема, чи ми говоримо про статистику частої чи байесівської ).

Підсумовуючи:

  • Функції прийняття рішень використовуються для прийняття рішень на основі даних.
  • Функції втрати використовуються для визначення, яку функцію прийняття рішення використовувати.

Для функцій параметричного рішення (наприклад, логістична регресія, порогове рішення) у вас в основному є одна можлива функція для кожної комбінації параметрів, а функція втрат використовується для пошуку найкращої. Поширений приклад: якщо ви використовуєте спуск градієнта для дослідження простору параметрів, ви отримуєте втрати щодо параметрів і опускаєтесь до (локального) мінімуму втрати.
pixelou

7

Функція втрат - це те, що зводиться до мінімуму для отримання моделі, яка є оптимальною в певному сенсі. Сама модель має функцію прийняття рішення, яка використовується для прогнозування.

Наприклад, у класифікаторах SVM:

  • L(w,ξ)=12w2+Ciξi
  • функція рішення: підписана відстань до роздільної гіперплани:f(x)=wTx+b

Чи не норма дорівнює відстані, чи я тут щось змішую ... Тож функція рішення завжди є частиною функції втрати, яку я використовую для "порівняння" з реальними значеннями, до яких я намагаюся виправити модель? І мета - мінімізувати цю "різницю"?
www.pieronigro.de

@ Hiatus норма функції роздільної гіперплани (яка оптимізується під час тренування SVM) не використовується у функції прийняття рішень. Використовується сама гіперплан. Мінімізація норми під час тренування в основному є формою регуляризації.
Марк Класен

Було б краще дати більш загальну відповідь, яка не прив’язана ні до якого конкретного класифікатора.
smci
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.