Я думаю, у вас є хороший сканер, який читає robots.txt та дотримується директиви. І інший, який не відповідає директиві.
І як ви плануєте надати цю URL-адресу? По електронній пошті, використовуючи Facebook чи Twitter? Усі ці служби сканують інформацію, яку ви надсилаєте. Електронна пошта для розбору електронної пошти, яку Ви отримуєте, для отримання реклами. Отже, ваша URL-адреса буде якось переповнена.
Деякі користуються панеллю інструментів Google (або будь-якою іншою панеллю інструментів пошукової системи). Є варіант (перевіряється за замовчуванням, якщо я добре пам’ятаю), що дозволяє панелі інструментів надсилати всі URL-адреси, які ви відвідуєте в Google. Це ще один спосіб для Google побачити приховану павутину. Тож навіть якщо ви сказали людині не ділитися URL-адресою, це неявно він зробить (завдяки панелі інструментів).
Я думаю, що ми можемо знайти багато інших можливостей.
Таким чином, ви можете додати його до robots.txt, але також надавати додаткові мета, такі як noindex, nofollow тощо.
редагувати:
Пропозиція w3d щодо robots.txt мені здається гарною. Тому не додайте його до robots.txt та надайте мета-тег пропр.