Що НЕ можна знайти в Google? [зачинено]


18

Google стверджує, що це справедливо, і компанія (в більшості випадків) зацікавлена ​​в тому, щоб шукати в Інтернеті що-небудь і все, до чого можуть отримати доступ його павуки. Я хочу знати:

  • Який тип (загальнодоступного) вмісту Google не доставляє?
  • Чи існує певний тип вмісту, який Google не може отримати?

Посилання, особливо на власну документацію Google, були б особливо приголомшливими.


Тепер, коли ЄС прийняв «Право забути», ми вже не зможемо знайти його. Ось деякі речі, які були "забуті".
samthebrand

Відповіді:


21

Кілька ідей щодо типу речей:

  1. Вміст, явно заборонений robots.txtфайлом домену, виключається з індексу Google.
  2. Веб-сайти, не пов’язані з іншими веб-сайтами, які Google вже знає. Тобто, мабуть, існує багато веб-сайтів, які не пов'язуються із видимих ​​сторінок; ці веб-сайти ніколи не будуть знайдені павуком Google, якщо вони не надсилаються в Google вручну через Інструменти для веб-майстрів .
  3. Веб-сайти, які стоять за веб-формами, які потрібно заповнити.
  4. Переписні зображення. Оскільки вміст - це зображення, які часто індексуються вручну, вони зазвичай знаходяться на платних сайтах, таких як pretstry.com.

Дізнайтеся більше про Deep Web


2
Пункт 2 - це неправда. Ви можете подати сайт в Google через Інструменти для веб-майстрів , і він буде індексуватися, навіть якщо він не пов’язаний з іншими веб-сайтами.
Олексій

Це правда. Гарне уточнення.
amh

3
Власне, я не погоджуюся з другим моментом. У мене на ПК був тестовий веб-сервер, і він був індексований. Я виявив це, перевіривши журнал доступу.
Бакудан

2
Я зареєстрував нові домени, почав їх розробляти і виявив, що Googlebot сканує їх лише через кілька днів. Я подумав, що це було якось моторошно, поки я не зрозумів - я, можливо, не є першою людиною, яка володіє цим доменом :) Вони не розголошують конкретики, але я впевнений, що вони стежать за доменами, які люди вважали досить важливими для реєстрації та на принаймні кілька відвідуваних у якийсь момент, принаймні на певний період часу.
Тім Пост

6

Крім Twitter, Google не індексує Tumblr все так добре. Записи блогу на Tumblr простіше знайти за допомогою пошуку в Tumblr. Також все на Сайтах Google не (або майже не є) індексованим. Якщо ви запускаєте сайт Google, отримайте власний домен.

Блоги, які не регулярно оновлюються, часто скидаються з результатів пошуку. Плюс все, що вони думають, - це осколок .


5

Ну, більшість контенту Twitter не індексується Google, навіть якщо він є загальнодоступним. Раніше він був доступний Google, але це вже не так, оскільки термін їх дії закінчився.

Джерело .


Хоча це правда, питання задає питання про те, що "якісний вміст" недоступний в Google. Більшість Twitter не відповідатиме цим критеріям :) Хоча я бачу дивний твіт в пошуку Google.
HappyTimeGopher

4

Це залежить, в якій країні ви знаходитесь. У Німеччині не відображаються тисячі сайтів, які, на думку уряду, є для вас непоганими, а список щороку збільшується на тисячі.

Google є двигуном цензури Інтернету. Якщо ви хочете отримати безкоштовний Інтернет, використовуйте кілька недобрих компаній, наприклад DuckDuckGo чи інших.




1

Сайти з настільки великим вмістом, що Google просто не встиг (або схильність) проіндексувати все це.

Сайти, які не мають скануючої карти сайту та вимагають від google надавати пошукові терміни для доступу до результатів, доступних на сайті, можуть не повністю індексуватися.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.