У мене є група з n наборів, для яких мені потрібно обчислити якесь значення "унікальності" або "подібності". Я визначив індекс Жакарда як відповідний показник. На жаль, індекс Жаккарда працює лише на двох наборах одночасно. Для того, щоб обчислити схожість між усіма наборами, знадобиться в порядку n 2 обчислення Жакарда.
(Якщо це допомагає, зазвичай становить від 10 до 10000, і кожен набір містить в середньому 500 елементів. Зрештою, мені байдуже, наскільки подібні будь-які два конкретні набори - скоріше, мені цікаво лише, яка внутрішня схожість всієї групи множин є. (Іншими словами, середнє значення (або, принаймні, досить точне наближення середнього значення) всіх індексів Жаккарда в групі))
Два питання:
- Чи існує спосіб використання індексу Жакарда без складності ?
- Чи є кращий спосіб обчислити схожість / унікальність набору для групи наборів, ніж спосіб, який я запропонував вище?