Традиційний аналіз прекрасний. "Традиційний" аналіз - це, якщо він пояснений правильно, наближення; він заснований на обчисленні очікуваної кількості комірок, що дорівнює 0/1, коли ви хешуєте ключі у фільтр, а потім аналізуєте так, ніби це було фактичне число. Справа в тому, що кількість комірок, які дорівнюють 0 (або 1), щільно сконцентровані навколо їх очікування, тому це точне наближення. Це було добре відомо, і я думаю, це можна знайти навіть у моїй статті опитування з Андрієм Бродером.
У цьому документі йдеться про те, що дійсно ефективність фільтра Bloom є випадковою змінною (що відповідає дійсній частці записів 0/1), і якщо ви хочете обчислити цю продуктивність саме з якихось причин, вам потрібно зайнятись комбінаторикою. Для менших фільтрів ви побачите, мабуть, нетривіальну різницю.
Я спілкувався з авторами цього документу. Їх аналіз все добре і добре (хоча я б стверджував, що він не є глибоким чи новим); їх мотивація того, що «традиційний аналіз неправильний» була, я думаю, перебільшеною.