Видаліть повторювані повідомлення з Maildir


10

У мене є купа дублікатів повідомлень у Maildir мого сервера IMAP. Який найкращий спосіб їх видалити?

Деякі відповідні моменти:

  • Спільний ідентифікатор повідомлення зазвичай є досить хорошим визначенням дубліката. Крихітний сценарій, який видаляє всі, крім одного з повторюваних повідомлень, спрацював би.
  • Іноді доводиться знаходити дублікати на основі спільних тел повідомлень. Яке тут загальне визначення? Побітовий еквівалент? Що з дивними відмінностями в обертанні рядків, втечах, кодуванні символів?
  • Іноді між "повторюваними" повідомленнями є якась змістовна різниця. Який найкращий спосіб переглянути відмінності в наборах "копій" повідомлень? Відмінності?

Відповіді:


6

Я вніс кілька суттєвих вдосконалень у згаданий вище сценарій Кевіна, і він був досить люб'язним, щоб прийняти мої прохання про витяг. Врешті-решт ми розділимо це на спеціальний проект, який ви можете знайти тут:

https://github.com/kdeldycke/maildir-deduplicate


Цей сценарій перемістився на нове місце, тому я оновив посилання.
Адам Шпієр

3

для загальних файлів у Linux я використовую утиліти fdupes для видалення дублікатів файлів. Я виявив, що це також працює для повідомлень Maildir.


1
fdupes, здається, працює лише для точних дублікатів, тоді як ОП (неявно) запитує про більш складні зразки дублювання. Повідомлення, що надсилається двічі через .forwardабо в іншому випадку, матиме дещо різні заголовки, тому, хоча саме повідомлення є дублікатом, двох файлів, що містять дві копії, може бути і не.
трійка

0

Gnome's Evolution (графічний агент користувача пошти) має вбудовану функцію для видалення дублікатів пошти. Як пояснено на цій довідковій сторінці , вона зводиться до:

  1. Виберіть підозрілі повідомлення (або просто всі повідомлення)
  2. Перейдіть до меню " Повідомлення" , виберіть " Видалити копії повідомлень" .

Voilà.

PS Evolution може отримати доступ до ваших повідомлень локально (MailDir, MH, Mbox) або через IMAP.


0

Найкраще , що я знайшов сьогодні Кевін Deldycke в Maildir-Дедупліціровать .

  • Він ігнорує X-MIMETrackзаголовок за замовчуванням і порівнює заголовки, використовуючи SHA224дайджест.
  • Він автоматично видаляє дублікати, не вимагаючи підтвердження; однак існує режим «сухого запуску», який дозволяє попередньо переглянути, які дублікати будуть видалені.

Надіюсь , хтось може зробити щось фантазійне з delIMAPdups.pl Ріка Сандерса , що є частиною його Інструментів IMAP .


maildir-deduplicate переїхали на нове місце, тому я оновив посилання. Однак Ваша інформація зараз застаріла.
Адам Шпієр

Я оновив це, щоб більше не вводити в оману застарілу інформацію.
Адам
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.