Ресурси для вивчення методик з декількома цілями?


11

Я шукаю ресурси (книги, конспекти лекцій тощо) про методи, які можуть обробляти дані, які мають кілька цілей (напр .: три залежної змінної: 2 дискретні та 1 безперервна).

Хтось має ресурси / знання з цього приводу? Я знаю, що для цього можна використовувати нейронні мережі.

Відповіді:


6

Випадковий ліс справляється з цим досить добре, див. Чи можливий / практичний випадковий ліс з кількома виходами? або scikit вивчити документацію . Я думаю, що ГБМ або будь-який метод на основі дерева може бути адаптований аналогічно.

Більш загально, коли ви запускаєте будь-який алгоритм навчання, що мінімізує бал, ви зазвичай працюєте над мінімізацією яка є одновимірною. Але ви можете вказати будь-яку цільову функцію. Якщо ви працювали над (двовимірним) прогнозуванням позиції, був би хорошим показником.i(pi-уi)2i(у^i-уi)2+(х^i-хi)2

Якщо у вас змішаний тип (класифікація та регресія), то для визначення цільової функції, ймовірно, потрібно буде вказати цільову функцію, яка надає більшої ваги деяким цілям, ніж інші: яке масштабування ви застосовуєте для постійних відповідей? Яку втрату ви застосовуєте до пропущених класифікацій?

Щодо подальшого академічного читання,

Вікіпедія Структурованого навчання SVM

Одночасне використання вихідних та цільових структур для регресії з декількома виходами

Метод вибору орієнтиру для прогнозування декількох вихідних даних (стосується величин, що залежать від розміру)


1
Враховуючи, що багатоцільовий регрес також має намір моделювати відносини між Ys, чи не хочете ви функцію втрат, яка вимірює відповідність цим відносинам?
Макс Ghenis

3

Цей документ добре допомагає описати поточні методи, набори інструментів, а також набори даних для перевірки.

Мені трапляється працювати над комерційною проблемою, яка потребує багатоцільової регресії, і я виявив, що інструментарій Clus має гарну суміш високої продуктивності та надійності

  • Документація відмінна
  • У наборі інструментів є кілька методів як для багатоцільової класифікації, так і для регресії
  • Він також підтримує індукцію та кластеризацію на основі правил.
  • Моделі ансамблю (Bagging, RandomForest), якими я користувався, можна легко читати та інтерпретувати.

Деякі новітні методи (після 2012 року) були реалізовані як розширення набору інструментів Mulan, ось посилання Github . Хоча такі методи, як випадкові лінійні цільові комбінації, відзначають кращі показники, ніж ансамблеві моделі, я виявив, що інструментарій не такий зрілий, як набір інструментів Clus, а значить, не використовував їх.


0

Баєсівська проблема бере на себе подібну проблему: непараметричні моделі Баєса для просторово індексованих даних змішаного типу . Елемент множинної відповіді, що обробляється різними нормально розподіленими випадковими векторами та їх функціями зв'язку. Так що повна відповідь - це стек вектора нормалей, векторів відліків і вектора Бернуліса.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.