У мене є посилання як текстовий файл з довгим списком записів, і кожен має два (або більше) поля.
Перший стовпець - URL-адреса посилання; другий стовпець - це заголовок, який може дещо відрізнятися залежно від способу внесення. Те саме для третього поля, яке може бути, а може і не бути.
Я хочу визначити, але не видаляти записи, у яких перше поле (URL-адреса посилання) однакове. Я знаю про це, sort -k1,1 -u
але це автоматично (неінтерактивно) видалить усі, крім першого звернення. Чи є спосіб просто повідомити мене, щоб я міг вибрати, який зберегти?
У витязі нижче трьох рядків, що мають одне і те ж перше поле ( http://unix.stackexchange.com/questions/49569/
), я хотів би зберегти рядок 2, оскільки він містить додаткові теги (сортування, CLI) та видалення рядків №1 та №3:
http://unix.stackexchange.com/questions/49569/ unique-lines-based-on-the-first-field
http://unix.stackexchange.com/questions/49569/ Unique lines based on the first field sort, CLI
http://unix.stackexchange.com/questions/49569/ Unique lines based on the first field
Чи існує програма, яка допоможе виявити такі "дублікати"? Тоді я можу вручну очистити, особисто видаливши рядки №1 та №3?