ЯКЩО вміст файлу вміщується в пам'яті, awkце добре для цього. Стандартний однолінійний файл в comp.lang.awk (я не можу шукати екземпляр з цієї машини, але їх декілька щомісяця), щоб просто виявити, чи є дублювання, awk 'n[$0]++'яке підраховує входження кожного значення рядка і друкує будь-які події крім першої, тому що дія за замовчуванням є print $0.
Щоб показати всі події, включаючи перше, у форматі, але, можливо, у змішаному порядку, коли більше ніж одне значення дублюється, виходить трохи більш вибагливим:
awk <sentences.txt ' !($0 in n) {n[$0]=NR;next} \
n[$0] {n[$0]=0; print "Line "n[$0]":"$0} \
{print "Line "NR":"$0} '
Показані в декількох рядках для наочності, зазвичай ви працюєте разом у реальному використанні. Якщо ви робите це часто, ви можете помістити awkскрипт у файл із awk -f, або, звичайно, все це у скрипті оболонки. Як і більшість простих, awkце можна зробити дуже подібним чином perl -n[a].