Як я можу визначити дублікати файлів зображень?


16

За ці роки я накопичив багато фотографій, через купу різних машин.

Я думаю, що я здебільшого тримав їх у структурі каталогів yyyy / mm /, але особливо на деяких старих зображеннях, як видається, багато дублікатів.

Який найкращий спосіб визначити дублікати? Чи є гарні інструменти для цього чи мені доведеться щось написати самостійно?


3
Ви хочете знайти приблизні збіги (скажімо, одне і те ж зображення, різні метадані), чи точні збіги знаходять достатньо?
Прочитайте, будь ласка, профіль

Точні матчі будуть досить хорошими.
chris

можливо, подивіться на розміри файлів?
aaaaa повідомляє відновити Моніку

Відповіді:


7

У ряді програм можна знайти дублікати на основі вмісту зображення. Деякі програми управління активами будуть це робити, а також є спеціальні програми. Якщо ви «виявите дублікати зображень Google», ви побачите досить багато варіантів. Подивіться, які доступні для вашої платформи.

Ще одне рішення - просто імпортувати файли з опцією "ігнорувати дублікат". Picasa, яка є безкоштовною, може це зробити.


Google виявляє повторювані зображення насправді працює, як і було обіцяно. Існує велика кількість такого програмного забезпечення. Ви можете порекомендувати що-небудь інше, ніж Picasa?
Еса Пауласто

4

Для Linux спробуйте FSlint . Це трохи повільно, але напевно знайде дублікати.


FSlint буде шукати файли з однаковим хеш-значенням. Як такий, він знайде дублікати будь-якого файлу. Це не допоможе в сценарії "однакові зображення-різні метадані" або зі зміненими версіями оригіналу.
seb

4

dupeGuru Picture Edition - це налаштовуваний дублікат пошуку зображень для Windows, Mac OS X та Linux.

Існує декілька версій dupeGuru (стандартні видання для музики та малюнків), а видання зображень дозволяє знаходити візуально схожі зображення за допомогою алгоритму порівняння растрових блокувань порівняння, серед інших методів (наприклад, EXIF ​​оригінальної часової позначки зображення або файли просто однакові) .

Він має безліч інших корисних функцій, таких як виключені папки, підтримка бібліотек iPhoto / Aperture та значне налаштування того, як він виявляє дублікати та що з ними робить.


3

У Picasa є пошук дублікатів файлів, але важко сказати, на що ви дивитесь: Запустіть Picasa; натисніть Tools> Experimental> Show Duplicate Files. Це працює, але будьте обережні, що ви видаляєте.

Ще один варіант - безкоштовний «Швидкий пошук копій файлів»:

Швидкий пошук копій файлів

Що мені сподобалось, це те, що він дозволяє вам переглянути попередній малюнок, перш ніж вирішити, що вам не потрібен дублікат.

alt текст

Це добре працює, поки файли однакові , але якщо ви шукаєте подібні фотографії (наприклад, однакові фотографії, але розміри, розміри, обертання або маніпулювання), ви можете заглянути в їх оновлену версію:

Візуальна схожість пошуку дублікатів зображень

Я не використовував цю програму, але я використовував дуже подібну програму (більше не робився), і я вважав її дуже корисною. У них є безкоштовне завантаження, тому, можливо, варто перевірити.


Я спробував шукач дупи Picasa, але, схоже, він відповідає подібним зображенням, а не однаковим файлам.
chris

2

digikam (linux, windows та mac) має версії бічної панелі з назвою

На вкладці "Версії" відображається історія та збережені версії фотографії. За допомогою трьох кнопок у верхньому правому куті ви можете вибрати між простим списком збережених версій, переглядом дерев та комбінованим списком, який показує версії разом із діями, виконаними з обраною фотографією.

і ще один під назвою пошук

Швидкий пошук - це адаптивний вікно пошуку у верхній частині діалогового вікна пошуку (зліва на бічній панелі) і надає вам простий спосіб пошуку в базі даних digiKam за допомогою одного запиту. Ви можете ввести будь-які аргументи в текстове поле Пошук: це буде використано для визначення результатів. Наприклад, ви можете ввести рядок 'Birthday' для пошуку повної бази даних щодо появи слова 'Birthday' у всіх текстових полях метаданих, або '05 .png 'для пошуку конкретного імені файлу зображення '05 .png' ( не втеча, як у регекспресіях).

(Він також має розширені налаштування, що дозволяють здійснювати кілька булевих пошуків)

і ще одна назва нечітка

digiKam характеризує кожне зображення довгим числом, використовуючи спеціальну техніку (алгоритм Хаар), яка дає можливість порівнювати зображення, порівнюючи цей обчислений підпис. Чим менше числова різниця між будь-якими двома підписами зображень, тим більше вони нагадують один одного. Ця методика має три реалізації в digiKam: ...

  1. Дублікати
  2. Зображення (Подібні товари)
  3. Ескіз

Хоча генерування "підписів" та перехресна перевірка їх на великій кількості зображень може бути повільним процесом. Також пам’ятайте, що деякі люди не шанувальники, оскільки це проект KDE, який не повністю інтегрується з іншими робочими середовищами, і він намагається бути все в одному додатку із завантаженням зображень, каталогу / ключових слів, розробкою RAW, маніпуляцією зображення та ін. включено.


1

Similar.pictures - це онлайн-програма для пошуку близьких та точних дублікатів.

Я написав це тому, що Picasa раніше знаходив точні копії. І ось Пікаса вже немає.


1

Мої два центи. Я використав:

Pixiple github.com/saolaolsson/pixiple

VisiPics visipics.info

І Awesome Duplicate Photo Finder duplicate-finder.com

Одне, що слід враховувати, - це «нечіткість» пошуку. Іноді програма знаходить схожі фотографії, наприклад, варіанти однієї фотосесії. Не майте щасливого тригера під час видалення зображень.


Будь ласка, створіть резервну копію своїх зображень, перш ніж щось видаляти.


0

Acdsee - це простий / популярний додаток для перегляду фотографій, який має цю функцію (Інструменти -> Знайти дублікати).


0

На моєму Mac я мав відмінний успіх у PhotoSweeper ( http://overmacs.com/ ). Він може працювати безпосередньо через файлову систему або за допомогою популярного програмного забезпечення для фотографій, такого як Apple Photos і Adobe Lightroom. Він може знайти точні дублікати або подібні файли зображень. А в 10 доларів - це крадіжка.


-1

DeDup-Image - це сценарій bash для автоматичного пошуку та видалення однакових зображень / дублікатів фотографій, навіть якщо метадані відрізняються. Він завжди зберігає найбільшу копію, яка, ймовірно, містить найбільше метаданих і видаляє всі інші знайдені об'єкти на основі SHA256-HASH інформації реального зображення без будь-яких метаданих. Оскільки сценарій повинен обробляти варіант із кожного зображення без метаданих, він трохи повільніше і більш інтенсивний для процесорів, ніж програми чи сценарії, які можуть шукати лише абсолютно однакові файли.


4
Ця програма виглядає дуже небезпечно, оскільки автоматично видаляє. Я справді, дуже не хотів би, щоб якась програма видаляла файли тут і там.
Рафаель
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.