Перетворення списку часткових рейтингів у глобальний рейтинг


13

Я працюю над чимось подібною проблемою. У мене є маса користувачів і N книг. Кожен користувач створює упорядкований рейтинг усіх прочитаних книг (що, ймовірно, підмножина N книг), наприклад, Книга 1> Книга 40> Книга 25.

Тепер я хочу перетворити ці індивідуальні рейтинги користувачів в єдиний упорядкований рейтинг усіх книг.

Чи є якісь хороші чи стандартні підходи до спробу? Поки що я думаю про моделі Бредлі-Террі, застосовані для парних порівнянь, але мені цікаво, чи є ще щось.


2
Я б подумав, що ви зіткнетеся з безліччю проблем із рідкістю, якщо тільки користувачі (чомусь не прочитають) подібні книги. Але зважаючи на російських людей і зважаючи на те, що більшість людей читають порівняно мало книг, переважна більшість пар матиме порівняння лише однією людиною. (Середнє число становило 6 на людину на рік, див. Пью
Пітер Флом - Відновлення Моніки

2
(+1) raegtin, ви задаєте приємні, цікаві запитання. Мені подобаються моделі BT, але, здається, тут змушений тад. Чи знайомі ви з спільною фільтруючою літературою? Це не та сама проблема, але деякі поняття та прийоми можна запозичити. Питання, яке не залишається без уваги, полягає в тому, чому слід вважати, що книгам можна в першу чергу дати однозначну, чітко визначену оцінку. (Як би ви поводилися, наприклад, з двома користувачами, дворуковими справами?)
кардинал

@ Peter Flom: Правильно, більшість пар не мають порівнянь. Але я сподіваюся, що це добре, адже якщо ви знаєте, що A> B і B> C, то навіть якщо A і C не порівнюються безпосередньо, ви можете зробити висновок A> C.
raegtin,

@cardinal: Так, моделі BT тут здаються вимушеними, але це єдине, про що я зараз можу подумати. Мені знайома література про спільну фільтрацію, але я не впевнений, як вона застосовується тут, оскільки я хочу класифікацію, а не схожість. Це правда, що єдиний глобальний рейтинг не обов'язково має сенс (наприклад, чи є сенс порівнювати дитячі книги з книгами для дорослих? Художня література проти нехудожня література?), Але практично це все-таки корисно. Списки книг "Найкраща з" весь час
спливають

Крім того, я не так сильно переймаюсь тим, як замовляти близько (наприклад, чи книга №1 справді краща, ніж книга №2), а швидше замовлення в сукупності (наприклад, я хочу, щоб перші 10% книг, які я замовляв, бути краще нижнього 10% або середнього 10%).
raegtin

Відповіді:


2

Якщо ви зацікавлені у використанні (більше, ніж у розробці), спробуйте спробувати ранжирувати нашу систему ранжирування.

Rankade безкоштовний і простий у використанні, і відрізняється від моделі Бредлі-Террі та системи ранжування Elo (ось порівняння ), оскільки він може керувати матчами з 2+ фракціями (тобто книгами, у вашому сценарії). Вставляючи впорядковані користувачем рейтинги (як відповідність між двома чи більше книгами, з детальним підсумковим заліку, включаючи зв'язки), ви отримаєте єдиний упорядкований рейтинг усіх шуканих книг . У залежності від наркоманії, рангад дає можливість перевірити еволюцію часу для ранжування книг, а також статистику збігів книг тощо.


1
Вам слід описати свій алгоритм, принаймні загалом, як підхід. І посилання на папір, де вона описана повністю. Інакше ваша відповідь може розглядатися як просто реклама.
ttnphns

1
Я додав посилання для простого порівняння між Ри і найвідомішою системою ранжирування. Перша заява говорить про те, що якщо ви зацікавлені у використанні (більше, ніж у розробці) , тому він пропонується як рішення проблеми (у рандері є графічний інтерфейс, тоді як Бредлі-Террі та Плакетт-Люс потрібна реалізація), більше ніж шлях до потрібного рішення.
Томазо Нері

1

Моделі ранжування Плакетт-Люсі займаються цією проблемою і є методом, заснованим на ймовірності, коли ймовірність максимально використовується за допомогою процедури мажоризації-максимізації, що є аналогічним максимізації очікування, в тому сенсі, що вони використовують допоміжну функцію об'єкта над функцією ймовірності, яка є оптимізований для забезпечення ітеративної монотонної максимізації функції ймовірності. (див. алгоритми ММ для моделей ранжування Плакетта-Люса Девіда Хантера). Він також надає код.

>=

Це ідеально відповідає вашому набору даних:

Книга 1> Книга 40> Книга 25

Книга 40> Книга 30

Книга 25> Книга 17> Книга 11> Книга 3 тощо.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.