Чому на першій сторінці Google каже, що є тисячі результатів, а на останній - менше сотні?


11

Чому на першій сторінці Google каже, що є тисячі результатів, а на останній - менше сотні?

Це такий тип рекурсивного пошуку в Google, який повинен бути зрозумілим. Мені знадобилося певний час, щоб підправити вирок і намагатися знайти число, яке б точно відповідало, причину, чому я замінив його на " сотні "! : P

Якщо ви досить довго користуєтесь Google, то, безперечно, багато разів натрапляли на подібні ситуації. Кожен раз, коли він показує менше 10 сторінок, це досить легко побачити. Справа в тому, що кількість результатів на будь-якій сторінці, крім останньої, здається жахливою оцінкою .

Що ще дивніше, коли випадкові рази оцінка раптом стає набагато кращою і майже точно однаковою на всіх сторінках, ніж на останній сторінці - єдиній, яка завжди правильна.

Отже, хто знає чому?


1
Зараз на першій сторінці для цього пошуку написано 3200 результатів, але на останній сторінці написано 75 (для людей, які цікавляться оновленням)
dkuntz2,

@DKuntz мені 2990 і 65 (поки я ввійшов), якщо я вийду (саме так я це зробив у перший раз), це перетвориться на 3120 і 77. Можливо, пізніше я трохи зміню питання і буду до більш послідовного рекурсивного запиту - але будь-хто бажає зробити це також! : P
Крегокс

Google дивний.
dkuntz2

Моя завжди говорить про 208 результатів на останній сторінці, чи це 4 сторінки результатів, або 22, вона завжди пише 208.
mchid

Дивіться також searchengineland.com / ...
1110101001

Відповіді:


6

Я не знаю точної відповіді - можливо, ніхто за межами Google не знає. Але у мене є два дані, які можуть бути корисними.

Перший - це питання щодо XKCD :

Тож справді виглядає так, що існує певний поріг обсягу результатів, за яким Google, мабуть, каже «викрутити» та викидає гігантське число. Я думаю, це, мабуть, пов’язано з некомпетентністю, а не навмисним обманом; Я впевнений, що важко швидко створювати сторінки з багатьох джерел, і, можливо, для пошуку з великою кількістю результатів вони не встигають синхронізувати все. Тож вони підробляють цифри. Той факт, що це робить його схожим на те, що вони мають набагато більше результатів, ніж вони, мабуть, є лише ненавмисним бонусом.

Другий момент даних - від професора інформатики, який у мене був досить цікавий, і хвилював деяких друзів з Google з цього приводу. Вони сказали йому, що іноді стає дуже дорого зрозуміти, скільки результатів справді було повернуто за результатами пошуку, тому вони просто найкраще здогадуються і повертають першу сторінку результатів, про що найбільше хвилює всіх людей. Тільки коли ви насправді починаєте просвердлювати сторінки, Google заважає повністю обчислити решту сторінок.

Тож жодне з них не є остаточною відповіддю, але, сподіваємось, вони будуть корисні для пояснення видів проблем, які можуть спричинити неточності Google.

Редагувати:

Відповідь Сатьї на цій сторінці містить відповідь від веб-майстра Google KB.

Коли ви здійснюєте пошук, результати часто відображаються з інформацією: Результати 1 - 10 приблизно в XXXX.

Обчислення загальної кількості результатів пошуку Google - це оцінка. Ми розуміємо, що показник бального коштовності є цінним, і, надаючи оцінку, а не точний рахунок, можемо швидше повернути якісні результати пошуку.

Крім того, при натисканні на наступну сторінку результатів пошуку загальна кількість результатів пошуку може змінитися. У цьому випадку ми розуміємо, що деякі результати запиту є дублікатами, і згортаємо ці дублікати, щоб ви могли легше знайти конкретний результат, який шукаєте. Згортання дублікатів зменшує орієнтовну кількість результатів, а також загальну кількість сторінок результатів.


Хоча я люблю XKCD та колишніх викладачів, але ти мені кажеш, що я, мабуть, повинен запитати це на
stackoverflow.com

Я не думаю, що хтось із stackoverflow не матиме остаточної відповіді - якщо вам дійсно потрібно знати, ви повинні запитати Google. Я можу передати відповідь лише тому, хто кілька місяців тому запитав Google.
dsolimano

не шукаючи остаточної відповіді, лише одну із розумним глибшим поясненням, бажано, що це добре знайдено. Не зрозумійте мене неправильно, це ваше розумно, але сказати "тому що важко", навіть якщо це авторитетно і має сенс, для мене занадто мало. Хм ... можливо скептики.se: o
Крегокс

Приємно редагувати, тепер це хороший пошук! Хоча воно все ще говорить "тому що важко", а це означає, що я все ще сподіваюся на більш детальну інформацію. : P
cregox

7

Ні - число - це лише наближення .

Коли ви здійснюєте пошук, результати часто відображаються з інформацією: Результати 1 - 10 приблизно в XXXX.

Обчислення загальної кількості результатів пошуку Google - це оцінка. Ми розуміємо, що показник бального коштовності є цінним, і, надаючи оцінку, а не точний рахунок, можемо швидше повернути якісні результати пошуку.

Крім того, при натисканні на наступну сторінку результатів пошуку загальна кількість результатів пошуку може змінитися. У цьому випадку ми розуміємо, що деякі результати запиту є дублікатами, і згортаємо ці дублікати, щоб ви могли легше знайти конкретний результат, який шукаєте. Згортання дублікатів зменшує орієнтовну кількість результатів, а також загальну кількість сторінок результатів.


Я думаю, що це не дуже добре, якщо вони завжди обмежують кількість результатів лише більш ніж 1000. Якщо користувач хоче більше, він повинен показати більше. На мою точку зору, деякі загальні ключові слова повинні повертати дуже велику кількість результатів пошуку (наприклад, квітка, книга ...), і я думаю, що в Інтернеті існує багато різних картинок!

@ user11656 ви припускаєте, що пошук зображень Google працює так само, як пошук у стандартному додатку, який ви можете використовувати. У такому масштабі речі зазвичай працюють дуже по- різному. Можливо, не існує однозначної відповіді на те, що "всі зображення, що відповідають квітці", як сервер в Австралії, можливо, нещодавно завантажене зображення, яке ще не поширюється на сервер у США. Тоді вам доведеться розібратися з такими речами, як представлення дублікатів і як це зробити через мільйони зображень для мільйонів користувачів миттєво. Її важкі речі, і вам доведеться робити архітектурні компроміси.
Джордж Мауер

3

Підрахунок результатів Google - це безглуздий показник . Крім згортання дублікатів, ви також маєте випливає із способом, який рахується в першу чергу шляхом множення частот, і тим, що Google накладає обмеження, яке встановлює максимальну кількість результатів, які коли-небудь будуть повернуті.


2

Жодна з наведених відповідей не є правильною.

Оцінка Google повинна бути наближена до реальної кількості результатів, ніж наведена.

Це можна показати простим прикладом. Доберіть дещо часте слово на кшталт «Росія» чи «Майкл». Насправді має бути тисячі, якщо не сотні тисяч веб-сайтів в Інтернеті, які містять слова десь на їхньому сайті. Але результати Google можуть дати вам, скажімо, 700.

Правда полягає не в тому, що Google дає великі завищення, а в тому, що Google значно обмежує кількість результатів, які вона вам дасть. Це суттєво скорочує результати, на наш головний шкоду як для людей. Це прикро, тому що я хочу читати тисячі сайтів зі своїми умовами в деяких випадках.

Я знаю це, тому що я користувався Google довгий час, можливо, 10-15 років і помітив, що, як правило, результати для термінів скорочуються, а не довше, хоча кількість сайтів з однаковими термінами взагалі повинна зросли за час, коли я використовую Google.

Якщо в минулому, років тому я міг отримати, можливо, 1000 результатів за певні терміни, то зараз я отримую 500 результатів за ті ж умови, за які я б отримав 1000 результатів.


2
Зверніть увагу, що "вище" не має контексту у відповідях, оскільки їх можна сортувати декількома різними способами. Навіть якщо ви припускаєте сортування за замовчуванням за "голосами", їхні позиції змінюватимуться, коли додаватимуться голоси вгору та вниз.
алей

Дуже цікаво! Зараз Росія дає мені лише 322 результати, і це показано лише на останній 34-й сторінці . До цього могло б сказати 799 000 000 результатів! Хоча це приємне розуміння, воно все ще не здається правильним. Я також не вважаю, що перші оцінки є правильними, і наміри приносять лише результати, які показані, а не "скільки, на його думку, існує в Інтернеті", отже, остання сторінка, що це виправляє.
Крегокс

1

Проблеми з пошуковою системою Google (Зображення) полягають у тому, що вона спрямована на актуальність, скидаючи дисперсію. По-перше, важливо зрозуміти, як це працює. Зображення, завантажене в Інтернет, потрібно індексувати двома способами:

  • на основі оригінальності (зображення підлягає аналізу "розумним ботом" на основі кольору, розміру, візерунків, розпізнавання форми, типу тощо)
  • на основі схожості (зображення підлягає аналізу "розумним ботом2") і перехресне посилання на вже наявні зображення в базі даних і надалі позначено позначками однієї або двох категорій: "зображення відповідає" і "зображення схоже на ... ")

Після індексації зображення успадковує "ключові слова" в результаті розпізнавання, щоб уникнути показу результатів поза темою для ендузера. Вся справа в тому, що кожне ключове слово є окремою фразою з присвоєним значенням у%, виходячи з сили релевантності (тому групування більше слів у вікні пошуку призводить до менших результатів, а також при пошуку зображення, завантажуючи його або вводячи URL-адресу, Google призначить "здогадку" лише з найвищими ключовими словами, це означає, що пошук ніколи не показуватиме вам всі зображення просто тому, що пошук не призначений для цього)

Тож наприкінці дня, коли ви здійснюєте пошук зображень і прямо під полем пошуку, ви побачите величезну кількість, що говорить "25,270,000,000 результатів (0,55 секунди)", і його здебільшого завжди є фальшивим числом, тому що ви більше не отримаєте ніж 200 (максимум 500, але лише після того, як користувач цього запитує), результати, які також фільтруються, щоб виключити:

  • зовнішні дублікати (якщо одне і те ж зображення в два рази більше на одній сторінці сайту)
  • релевантні дублікати (показує лише "найкращі результати" - див. зображення нижче)
  • зображення, які мають проблеми із законом (див. зображення нижче)
  • зображення, що порушують DMCA (див. зображення нижче)
  • зображення, які походять із джерел СПАМУ, МАЛУАРІЇ, ФІШИНГУ
  • зображення, які є прихованими (якщо користувач не вимкнув Безпечний пошук)
  • зображення, які перебувають у чорному списку від Google ( стаття )
  • зображення з різною AR (в основному всі зображення, які мають інше співвідношення сторін, ніж посилання на пошук зображень. Наприклад, ви можете пропустити всі бажані результати, якщо шукати за обраним вами зображенням - скажімо, із дивним співвідношенням 9: 7 - в той час як усі зображення індексуються у Google має співвідношення 3: 4 - це, можливо, найбільший недолік цієї пошукової системи, оскільки вона завжди підкоряється співвідношенню аспектів як першому критерію)
  • і купа більше

Підсумовуючи це: результати пошуку зображення ніколи не є релевантними. Іноді ви отримаєте свій остаточний бажаний результат за допомогою пошукової фрази "ворота плакат", інакше це може бути "кришка воріт", "ворота bluray", "ворота DVD", "ворота 2015" або навіть "自衛隊 彼 の 地 に て 斯 く く 戦え り "- у вас просто не може бути результатів зображення" ВСІ ", оскільки немає" ВСІХ ", тому для того, щоб потрапити туди, потрібно грати. А також доречно зазначити, що є й інші пошукові системи зображень, які можуть зробити роботу набагато інакше, оскільки вони працюють за різними стандартами та критеріями. Це не є і ніколи не був "Google" - тільки ... >> https://www.yandex.com/images/

помітні розширення:


Знову ж таки, позначення їх як дублікатів було б набагато кориснішим, ніж розміщення відповіді на кожне питання.
jonsca

0

Угорі написано сторінка 70 з 7000 результатів (приклад). Це дасть номер сторінки та кількість результатів. Не 70 результатів, але 70 сторінок. Сподіваюсь, це допомагає.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.