У мене великий сортований файл з мільярдами рядків змінної довжини. З огляду на новий рядок, я хотів би знати, яке число байтів воно отримало, якби воно було включене до сортованого файлу.
Приклад
a\n
c\n
d\n
f\n
g\n
З огляду на вхід 'foo', я отримав би результат 9.
Це легко зробити, просто пройшовши весь файл, але, будучи мільярдами рядків змінної довжини, було б швидше виконати двійковий пошук.
Чи існує такий інструмент для обробки тексту?
Редагувати:
Це зараз: https://gitlab.com/ole.tange/tangetools/blob/master/bsearch/bsearch