У мене великий і зростаючий набір текстових файлів, які всі досить малі (менше 100 байт). Я хочу розрізнити кожну можливу пару файлів і зазначити, що є дублікатами. Я можу написати сценарій Python для цього, але мені цікаво, чи існує існуючий інструмент командного рядка Linux (або, можливо, проста комбінація інструментів), який би це зробив?
Оновлення (у відповідь на коментар mfinni ): Усі файли знаходяться в одному каталозі, тому всі вони мають різні назви файлів. (Але всі вони мають спільне розширення назви файлів, що дозволяє легко вибрати їх за допомогою підстановки.)