Моя компанія прагне створити PivotViewer візуалізацію клієнтських публікацій Wordpress 2 за останні 11 років. Для цього, однак, нам потрібно відредагувати дещо випадкові, неповні та загалом погані теги для використання як категорії сортування. Я шукаю інструмент, який аналізуватиме їх записи в блозі та здійснюватиме підрахунок слів, щоб дати зрозуміти, з чим ми маємо справу.
В ідеалі він би мав усі ці особливості:
- Чорний список слів (ігнорувати)
- Слово випливає
- Спеціальне злиття синоніму
- Підрахунок усіх цілей використання
- Підрахунок кількості публікацій, у яких відображається слово.
Я б міг подумати, що такий текстовий аналіз буде надзвичайно поширеним, але я не зміг знайти жодного програмного забезпечення, яке б робило подібні речі у цілих блогах. Чи доступне програмне забезпечення для цього?