Отже, фільтри Bloom досить круті - це набори, які підтримують перевірку членства, не маючи помилкових негативів, але малий шанс помилкового позитиву. Нещодавно я хотів "фільтру Блюма", який гарантує протилежне: ніяких помилкових позитивів, але потенційно помилкових негативів.
Моя мотивація проста: враховуючи величезний потік предметів для обробки (з дублікатами), ми хотіли б уникати обробки предметів, які ми бачили раніше. Обробляти дублікат не завадить, це лише марна трата часу. Але, якби ми нехтували обробкою елемента, це було б катастрофічно. За допомогою "зворотного фільтра Блюма" можна було зберігати побачені предмети з невеликим накладними витратами, а також уникати обробки дублікатів з високою ймовірністю, перевіряючи приналежність до набору.
Але я, здається, не можу знайти нічого подібного. Найближчі я знайшов - це " ретушовані фільтри Блюма ", які дозволяють торгувати вибраними помилковими позитивами для більш високої помилкової негативної ставки. Я не знаю, наскільки добре працює їх структура даних, коли потрібно видалити всі помилкові позитиви.
Хтось бачив щось подібне? :)