Запитання з тегом «web-crawlers»

Комп'ютерна програма, яка отримує доступ до веб-сторінок для різних цілей (для скребки вмісту, для надання пошуковим системам інформації про ваш сайт тощо)

2
Міграція потоку Disqus. Отримав?
Я переміщав сайт на новий домен. Сам сайт досить простий (він використовує Jekyll), і все пішло нормально - крім міграції ниток Disqus. Я мав частковий успіх - деякі нитки успішно мігрували, але не всі. Я спробував майстра з міграції домену (який зловив декілька), картографічний URL (який зловив декілька) та сканер …

2
Запросити сканера сайту sitemap вниз (назавжди)?
Я використовую Ask.comяк одну з пошукових систем для того, щоб пінг моєї карти сайту. Коли я сьогодні пішов писати свою мапу сайту, щоб повторно індексувати свою мапу сайту, веб-сайт ( http://submissions.ask.com/ping ) каже, що її більше не існує? Я здійснив пошук DNS submissions.ask.comі, схоже Ask.com, видалив піддомен, але їх FAQ-сканер …

3
Тактика поводження з недоброзичливими роботами
У мене є сайт, який з регуляторних причин може не індексуватися або шукатися автоматично. Це означає, що нам потрібно тримати подалі всіх роботів і не дозволяти їм розкручувати сайт. Очевидно, у нас був файл robots.txt, який від самого початку відключає все. Однак, спостерігати за файлом robots.txt - це лише те, …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.