Як моделювати поведінку покупців користувачів на Amazon?


9

Для нашого підсумкового курсового проекту з наукових даних ми запропонували наступне:

Надайте набір даних обзорів Amazon , ми плануємо розробити алгоритм (орієнтований приблизно на персоналізований PageRank), який визначає стратегічну позицію для розміщення реклами на Amazon. Наприклад, на Amazon є мільйони продуктів. І набір даних дає вам уявлення про те, з якими продуктами пов'язані, які продукти були об'єднані, переглянуті тощо. (Ми можемо побудувати графік із цією інформацією також переглянутої, а також придбаної). Він також дає відгуки, пов'язані з кожним продуктом 14 років. Використовуючи всю цю інформацію, ми оцінюємо / класифікуємо продукти на Amazon. Тепер ви постачальник Amazon, який хоче покращити трафік на своїй сторінці продуктів. Наш алгоритм допомагає визначити стратегічні позиції на графіку, де можна розмістити свою рекламу, щоб ви могли отримати максимальний трафік.

Тепер питання нашого професора полягає в тому, як ви затвердите свій алгоритм без реальних користувачів? Ми сказали:

Ми можемо моделювати фіксований набір користувачів. Деякі користувачі переглядають also_boughtі also_viewedпосилаються на третій стрибок частіше, ніж на перший чи п'ятий. Там поведінка користувачів зазвичай розподіляється. Деякі інші користувачі навряд чи переходять за межі першого стрибка. Цей набір поведінки користувачів розподілено експоненціально.

Наш професор сказав: - Незалежно від розповсюдження користувачів, користувачі переходять за допомогою посилань на подібні продукти. Ваш алгоритм ранжування також враховує подібність b / w 2 продуктів до ранжирування продуктів. Тож використання цього алгоритму перевірки є своєрідним cheating. Подумайте про іншу поведінку користувача, щось більш реалістичне та ортогональне для алгоритму.

Будь-які ідеї щодо моделювання поведінки користувачів? Я радий надати більш детальну інформацію про альго.

Відповіді:


1

Як ви затвердите свій алгоритм?

Замість того, щоб намагатися відповісти на друге питання, врахуйте, що ваша відповідь на перше питання може потребувати перегляду ...

Які методи ви використовували для перевірки методів навчання на всьому уроці наукових даних? Спочатку потрібно визначити конкретний набір числових показників, щоб оцінити успішність або провал вашої моделі. По-друге, які методи ви можете використовувати для створення дуже реалістичної тестової сукупності (більш реалістичної, ніж моделювання населення)? Перша підказка, яку я надам, - це те, що набір даних Amazon Reviews дуже великий, тому ваші дані дуже корисні для цього методу. Другий натяк, який я надам, полягає в тому, що цей метод, ймовірно, той, який ви використовували в 95% контрольованих проблем навчання, над якими ви працювали в класі ...

Сподіваюся, це допоможе ... Я відредагую це, якщо потрібно, базуючись на коментарях, доданих ОП, але не хочу одразу надати рішення, щоб викликати органічну думку, наприклад, оскільки це проблема класу, а професор також намагаються допомогти вам самостійно знайти правильне рішення.


0

Існує дві вимоги до моделі поведінки, яку ви повинні використовувати: (1) "більш реалістичний" та (2) ортогональний для вашого алгоритму.

(1) Реалістично припустимо, що це означає, що поведінка повинна відображати поведінку, що спостерігається в інших, більш широких контекстах, ніж конкретний контекст закупівель Amazon.

(2) Ортогональні зрозуміліші. Модельована поведінка не повинна визначатися подібністю продуктів.

Простий підхід до виконання цих двох вимог випливає з того, що поведінка щодо придбання визначається соціально-демографічними особливостями, такими як стать, вік, місце розташування (наприклад, міська територія / сільська місцевість) та економічні обмеження (дохід та ціна).

У вас є набір користувачів і набір продуктів. Ви можете оцінити взаємозв'язок між соціально-демографічними змінними та попитом на продукт, використовуючи прості, але ретельні методи регресії. Якщо потрібно, ви можете використовувати зовнішні джерела даних, щоб зробити припущення щодо важливих відсутніх змінних, таких як дохід.

Тоді, якщо ви продавець, соціально-демографічна модель передбачає, які групи найімовірніше придбають ваш товар.

Я сподіваюся, що це допомагає :)

Бен

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.