У мене два документи ODT, вони мають дуже близький зміст, я хочу порівняти їх, щоб побачити, наскільки вони схожі.
Найкраще було б мати відсоток схожості , якщо це неможливо, альтернативою було б принаймні мати певну різницю .
Я запускаю Ubuntu Lucid .
Рішення:
Я використовував odt2txt
для перетворення файлів у текст, потім використовував wdiff -i --statistics one.txt two.txt
різницю разом зі статистикою, яка давала мені відсоток загальних слів (подібність).