Швидкі виправлення HTML для тегів поза замовленнями та незакритих тегів


0

У мене є кілька документів HTML, які мені потрібно виправити. Основні проблеми у файлі:

  • Теги поза замовленням ( <p><i>like this</p></i>)
  • Незакриті теги ( <p>like this)

Я знаю, що результат не буде ідеальним, але мені потрібно швидко усунути ці прості проблеми для подальшої обробки.

Чи є інструмент для цього? Мені потрібно інструмент командного рядка, який працює на Mac OS X або Linux. Якщо немає нічого, я закінчу писати своє, але я вважаю за краще щось, що вже побудовано для завдання, якщо воно існує.

Для уточнення: Це не питання щодо рекомендацій щодо програмного забезпечення - я майже впевнений, що немає жодного програмного забезпечення, яке б це зробило, я більше шукаю шматочки та шматки, як, наприклад, sed / awk / Python / тощо. що може це досягти. Дві основні проблеми - це невпорядковані та незакриті теги, згадані вище. Якщо я можу їх вирішити, інші проблеми вирішити набагато простіше (кодування тощо)


На жаль, рекомендації щодо програмного забезпечення поза темою. Ми можемо допомогти вам щось написати, але нам слід знати, які теги ви шукаєте.
тердон

Я точно не шукаю рекомендацій щодо програмного забезпечення, але більше рекомендацій щодо інструментів або прийомів для його виконання без написання повністю спеціальної програми. Наприклад, може бути доречним кілька команд sed або сценарій awk, але мої знання з регулярних виразів досить обмежені. Крім того, sed може не працювати, оскільки вони можуть охоплювати кілька рядків, тому awk або навіть просто користувацький скрипт Python може бути найкращим рішенням. Я досить відкритий до пропозицій.
Джастін Мрква

Річ у тому, що це не банально і не може бути виконано регулярними виразами . Це може бути зроблено з регулярним виразом для невеликого списку конкретних тегів, але що робити з тегами, <input>які не закриваються? Або різниця між <p>і <p class="foo" style="color:blue">? Або <p>і < p>?
тердон

Відповіді:


0

HTML-порядок :

HTML Tidy - це інструмент для перевірки та очищення вихідних файлів HTML. Це особливо корисно для пошуку та виправлення помилок у глибоко вкладеному HTML або для того, щоб зробити ще раз розбірливий гротескний код.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.