Чи швидше шукати довгі або короткі пошукові терміни? Або це взагалі впливає на швидкість? Іншими словами, ви повинні зробити пошукові терміни максимально точними?
Існує понад 100 000 файлів, і кожен файл містить від 20 до понад 5000 рядків даних. Зазвичай grep використовується для пошуку лише одного екземпляра пошукової фрази.
Скажімо, пошуковий термін є SEARCHTERM
, і він буде такий ряд:
NAD+DP+1234567890:92++UNIQUE+NAME+SEARCHTERM++12345+FI'
Швидше шукати "ПОШУК" чи "ПОШУК"? Скажімо, що в цьому випадку нам байдуже, якщо ми також знаходимо збіги в інших непов'язаних рядках.
Ось як це я зараз роблю:
grep NAD+DP 123* | grep SEARCHTERM
Але я вважаю це досить повільним, все-таки. На пошук даних зазвичай потрібно 3-5 хвилин, навіть коли я знаю грубе ім'я файлу, яке обмежує діапазон приблизно до 10 000 файлів.
Отже, чи допоможе більш довгий або коротший пошуковий термін? Наскільки я знаю, grep шукає «блоки» слів певної довжини?