Це насправді відносно відома проблема в галузі машинного навчання. У ~ 2006 році Netflix запропонував $ 1 млн алгоритму, який забезпечив найкраще розумне вдосконалення їх системи рекомендацій. Теорія виграшного рішення коротко обговорена в цьому підручнику Caltech про вступне машинне навчання.
В основному використовувався ансамблевий метод навчання . Зокрема, застосовували тип змішування чи укладання . Це нетривіально, але своєрідно інтуїтивно. Щоб зрозуміти інтуїцію використання гармонійно різних статистичних підходів, розгляньте різні причини, яким різні люди люблять однакові фільми: тобто Джо може подобатися Топгун, тому що він любить бойовики 80-х, а Джейн подобається Топгун, тому що їй подобаються фільми з саундтреками Кенні Логінс. Тож той факт, що обидва глядачі переглядали (і оцінили фільм високо), не обов'язково означає, що вони сподобаються іншим фільмам з високою ймовірністю. Алгоритм прогнозування в ідеалі міг би врахувати ці відмінності, принаймні в якійсь якості.
Це може зробити рішення рішення досить простим, але врівноваження конкуруючих алгоритмів та визначення пріоритетності найкращої здогадки для кожного випадку, безумовно, не просте. Той факт, що Netflix запропонував таку велику винагороду, повинен зробити масштабність виклику досить очевидною.
Якщо ви тільки починаєте з машинного навчання, перевірка вищезазначених ресурсів може бути корисною залежно від рівня інтересів та вашого математичного досвіду. Тож регресія, ймовірно, спрацювала б добре, але можливі значно кращі показники.