Для того, щоб ваш файл PDF (або будь-який не HTML-файл) не відображався в результатах пошуку, єдиним способом є використання X-Robots-Tag
заголовка відповіді HTTP , наприклад:
X-Robots-Tag: noindex
Для цього можна додати наступний фрагмент до кореневого файлу .htaccess або файл httpd.conf:
<Files ~ "\.pdf$">
Header set X-Robots-Tag "noindex, nofollow"
</Files>
Зауважте, що для роботи вище, ви повинні мати змогу змінити заголовки HTTP відповідного файлу. Таким чином, ви, можливо, не зможете цього зробити, наприклад, на сторінках GitHub .
Також зверніть увагу , що robots.txt ніяк НЕ запобігти сторінку від бути перераховані в результатах пошуку.
Це не дозволяє боту сканувати вашу сторінку, але якщо стороння сторона посилається на ваш PDF-файл із свого веб-сайту, ваша сторінка все одно буде перерахована.
Якщо ви зупините бот від сканування вашої сторінки за допомогою robots.txt , він не матиме можливості побачити X-Robots-Tag: noindex
тег відповідей. Тому ніколи не забороняйте сторінку в robots.txt, якщо ви використовуєте X-Robots-Tag
заголовок. Більше інформації можна знайти в розробниках Google: метатег роботів .