У нас виникають проблеми з тим, щоб Google індексував PDF-файли на нашому сайті. Є близько 50 PDF-файлів і розмір діапазону від 20 Кб до трохи менше двох мег. Вони не захищені, їх можна читати анонімно, і всередині PDF Reader можна шукати документ.
Вони перераховані в SiteMap.xml. Я навіть можу переглянути журнали IIS і побачити Googlebot, який читає PDF-файли, але, за винятком п'яти, вони ніколи не включаються до результатів пошуку.
Якщо я роблю filetye: pdf, з'явилося лише п'ять PDF-файлів. Якщо я шукаю текст, який я знаю, знаходиться у форматі PDF, PDF-файли ніколи не відображаються (крім п’яти, які індексуються).
Хтось має уявлення, чому понад 45+ PDF-документа не включаються до індексу, хоча вони є в мапі сайту та Googlebot читає їх?