У мене є купа дублікатів повідомлень у Maildir мого сервера IMAP. Який найкращий спосіб їх видалити?
Деякі відповідні моменти:
- Спільний ідентифікатор повідомлення зазвичай є досить хорошим визначенням дубліката. Крихітний сценарій, який видаляє всі, крім одного з повторюваних повідомлень, спрацював би.
- Іноді доводиться знаходити дублікати на основі спільних тел повідомлень. Яке тут загальне визначення? Побітовий еквівалент? Що з дивними відмінностями в обертанні рядків, втечах, кодуванні символів?
- Іноді між "повторюваними" повідомленнями є якась змістовна різниця. Який найкращий спосіб переглянути відмінності в наборах "копій" повідомлень? Відмінності?