Є кілька різних способів видалення HTML tagsз NSStringдюйма Cocoa.
Один із способів - перетворити рядок у, NSAttributedStringа потім захопити виведений текст.
Інший спосіб - використовувати NSXMLDocument's- objectByApplyingXSLTStringметод застосувати XSLTперетворення, яке це робить.
На жаль, iPhone не підтримує NSAttributedStringабо NSXMLDocument. Для HTMLмене занадто багато крайових справ і неправильно оформлених документів, щоб відчувати себе комфортно за допомогою регулярного виразу або NSScanner. Хтось має на це рішення?
Одним із пропозицій було просто шукати символи, що відкриваються та закриваються, але цей метод не працюватиме, за винятком дуже тривіальних випадків.
Наприклад, ці випадки (з розділу Perl Cookbook з тієї ж теми) порушили цей метод:
<IMG SRC = "foo.gif" ALT = "A > B">
<!-- <A comment> -->
<script>if (a<b && a>c)</script>
<![INCLUDE CDATA [ >>>>>>>>>>>> ]]>