Я витягую URL-адреси з веб-сайту за допомогою CURL, як показано нижче.
curl www.somesite.com | grep "<a href=.*title=" > new.txt
Мій новий файл.txt, як показано нижче.
<a href="http://website1.com" title="something">
<a href="http://website1.com" information="something" title="something">
<a href="http://website2.com" title="some_other_thing">
<a href="http://website2.com" information="something" title="something">
<a href="http://websitenotneeded.com" title="something NOTNEEDED">
Однак мені потрібно витягнути лише наведену нижче інформацію.
<a href="http://website1.com" title="something">
<a href="http://website2.com" information="something" title="something">
Я намагаюся ігнорувати, <a hrefякі в них є інформація і чия назва закінчується на NOTNEED .
Як я можу змінити свою заяву grep?
Чи правильний результат, який ви тут показуєте? Текст, що описує це, не має сенсу разом з цим прикладом.
—
slm
Ви не шукаєте
—
terdon
curl www.somesite.com | grep "<a href=.*title=" | grep -v NOTNEEDED > new.txt?
@terdon, саме це я шукав. Я можу прийняти це як відповідь, якщо ви його опублікуєте.
—
Рамеш
Рамеш, це в основному відповідь @ slm. Я щойно відредагував його, щоб ви могли прийняти його.
—
тердон
о так, я не розумів, що труба така потужна. Я прийняв це як відповідь. Дякую!
—
Рамеш