Доступний позитивний користувачевий продукт (дані про кліки). Як генерувати негативні дані (без кліку)?


10

Дуже поширене в рекомендації про те, що у нас є дані про користувацькі товари, які мають мітку як, наприклад, "клацання". Для того, щоб вивчити модель, мені потрібні дані клацання та без натискання.

Найпростіший підхід для створення - це взяти пари продуктів-користувачів, які не знайдені в даних про кліки. Однак це може ввести в оману. Приклад:

user1, product1 (click) user2, product2 (click) user2, product3 (click) user3, product2 (click)

Я можу взяти user1 з усіма продуктами, крім product1 і позначити їх як "no_click" тощо. Але це може бути неправдою. Можливо, користувач1 натиснув bi product2, якби йому показали product2. Але тільки тому, що йому показали інші набори продуктів - у нього не було можливості вирішити натиснути / не натиснути продукт2.

Тож як вирішити проблему з одинарними даними?


1
Я думаю, ти відповів на власне запитання. Вам слід записати концепцію враження або показати. Якщо ви показали товар і його не було клацання, то це те, що ви шукаєте.

Але насправді цього немає в записаних даних. Ось що я згадав. Дані містять лише те, що пара користувачів-продуктів має ярлик кліку. Що було показано і що було натиснуто, не записується.
p.paliwal

Крім того, навіть якщо скажімо - користувачеві1 було показано prod1, prod2, prod3 (і він натиснув prod1) - тоді user1 з prod2 та prod3 матимуть ярлик без кліку. А як щодо решти продуктів (prod4, prod5, ...). Просто тому, що вони не були показані, користувач не мав можливості вирішувати клацання / не натискання. Це не говорить про те, чи буде зацікавлений користувач у не показуваних продуктах - тому маркування всіх інших комбінацій як не натискання може бути неправдивим у реальному. Це те, що я також пояснив у питанні.
p.paliwal

Відповіді:


6

Отже, є дві проблеми.

  1. Запис показів (шоу)
  2. Як боротися з не-враженнями

Для (1) ви повинні записувати цю інформацію. Якщо вона наразі не записується, слід почати записувати цю інформацію. Враховуючи, що у вас немає цієї інформації, ви хочете надати рекомендації. На щастя, за допомогою даних просто клацання ви все ще можете створити матрицю утиліти, див. 9.1.1.

http://i.stanford.edu/~ullman/mmds/ch9.pdf

Потім ви можете використовувати спільну фільтрацію на основі користувачів або предметів, як описано в статті. Це, в основному, вправа заповнення матриці утиліти та намагання знайти «бали» для неклікованих елементів. Ваша рекомендація - це пункт без натискання з найвищим балом.

Для (2) ви все одно будете робити рекомендації щодо неклікованих елементів. Отже, одне це не є проблемою. Однак ви захочете оптимізувати свої враження. Ви також не можете мати повні знання, де користувач може бачити всі можливі варіанти. Вам потрібно записати враження та зрозуміти низку речей.

  • показ швидкості товару
  • швидкість кліку елемента
  • як включити нові елементи
  • як оптимізувати, які предмети показати

Це величезна тема, і в основному це проблемна область інтернет-реклами. Однак система рекомендацій намагається знайти цікаві предмети в довгому хвості, що трохи відрізняється від оптимізації реклами. Це цикл зворотного зв'язку для оцінки вашої рекомендації. Тести A / B є загальними. Ви хочете перевірити частоту кліків та помилки рекомендацій між вашою поточною системою та новою системою.

Також дивіться тут.

http://cs.brynmawr.edu/Courses/cs380/fall2006/Herlocker2004.pdf

http://www.cs.umd.edu/~samir/498/Amazon-Recommendations.pdf

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.