Запитання з тегом «jsoup»

15
Як зберегти розриви рядків при використанні jsoup для перетворення HTML у звичайний текст?
У мене є такий код: public class NewClass { public String noTags(String str){ return Jsoup.parse(str).text(); } public static void main(String args[]) { String strings="<!DOCTYPE HTML PUBLIC \"-//W3C//DTD HTML 4.0 Transitional//EN \">" + "<HTML> <HEAD> <TITLE></TITLE> <style>body{ font-size: 12px;font-family: verdana, arial, helvetica, sans-serif;}</style> </HEAD> <BODY><p><b>hello world</b></p><p><br><b>yo</b> <a href=\"http://google.com\">googlez</a></p></BODY> </HTML> "; NewClass …
101 java  jsoup 

6
Я отримую SocketTimeoutException в Jsoup: Читання вичерпано
Я отримую SocketTimeoutException, коли намагаюся розбирати багато документів HTML за допомогою Jsoup. Наприклад, я отримав список посилань: <a href="www.domain.com/url1.html">link1</a> <a href="www.domain.com/url2.html">link2</a> <a href="www.domain.com/url3.html">link3</a> <a href="www.domain.com/url4.html">link4</a> Для кожного посилання я розбираю документ, пов'язаний з URL-адресою (з атрибуту href), щоб отримати інші відомості на цих сторінках. Тож я можу собі уявити, що …
100 java  jsoup 
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.