Веб-павук для Ubuntu


11

Я шукаю веб-павука для Ubuntu на зразок цього Webripper - програмного забезпечення Calluna . Ви можете завантажити цілий сайт, як можете

wget -r -m example.com

але особливістю, яку я шукаю, є те, що ви можете ввести пошуковий термін на зразок "Linux", і він здійснює пошук в Інтернеті та завантажує їх. Чи є такі програми на Ubuntu, як ця?

Відповіді:


4

Ви можете використовувати Google Alerts, щоб створити якусь пошукову сторінку, яка доставляється до каналу, а потім скористатися програмою RSS Reader або Thunderbird, щоб прочитати їх.

Я використовую Thunderbird для RSS. Я не знаю, чи є RSS-зчитувачі, які могли б експортувати канал на простий HTML.


9

Дайте httrack (CLI) або webhttrack (веб-інтерфейс) знімок, це знаходиться у Всесвітньому репо. Я не впевнений у характеристиці пошукового терміна, який ви описуєте, але він пропонує купу легко налаштованих варіантів.

http://packages.ubuntu.com/de/oneiric/webhttrack

Копір веб-сайтів HTTrack - Безкоштовний офлайн-браузер (GNU GPL)


3

Ви можете спробувати http ripper .

Ось деякі функції, розміщені на веб-сайті:

Free Software (GPL 3)
Generic (works with almost every website)
Runs on GNU/Linux and Windows
Nearly undetectable / blockable by servers
Built with python and pygtk

http://29a.ch/httpripper/screenshots/2.png Екран

Перегляньте підручник від самого розробника httpripper:

Посилання для завантаження:

Він працював для мене під Ubuntu 11.10 x64


Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.