Набори даних орієнтирів для спільної фільтрації


9

Я хотів би перевірити новий алгоритм спільної фільтрації . Типовим випадком використання є рекомендувати фільми на основі уподобань користувачів, схожих на конкретного користувача.

Назвіть декілька загальних наборів даних, які дослідники часто використовують для тестування своїх алгоритмів? Я знаю, що в Computer Vision люди часто використовують MNIST або CIFAR, але я не знайшов подібних наборів даних для спільної фільтрації.


1
Ви подивилися на набір даних призів Netflix? Так, конкуренція давно закінчена, і її зняли з офіційного веб-сайту через певні причини конфіденційності. Ви все ще можете спробувати знайти його в інших місцях.
Владислав Довгалеч

Kaggle.com має купу. Просто шукайте "рекомендація в: наборі даних" або "рекомендація в: конкуренція".
пробіг8

Відповіді:


8

Очевидною відповіддю був би набір даних призів Netflix, в ньому проводиться багато досліджень, і більшість алгоритмів CF знають його бали.

Є й інші наявні набори даних, які зазвичай використовуються як орієнтири:


1

У мене є сховище, яке могло б вам допомогти.

https://github.com/ArthurFortes/Datasets-for-Recommneder-Systems/


3
Будь ласка, не публікуйте відповідей лише на посилання, відповіді мають бути самостійними. Рекомендую відредагувати свою відповідь, щоб додати хоча б декілька інформації, яку надає посилання, а потім надати посилання для подальшого вивчення.
Мефі
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.