Ось пояснення безпосередньо з джерела (майже)
за хв 22:03
Вартий перегляду!
В основному і за словами Дугласа Меррілла, колишнього центрального директора Google, це так:
1) Ви пишете (неправильно написане) слово в google
2) Ви не знаходите того, що хотіли (не натискайте жодних результатів)
3) Ви розумієте, що ви неправильно написали слово, тому переписали це слово у вікно пошуку.
4) Ви знаходите те, що хочете (натискаєте в перших посиланнях)
Ця закономірність, помножена на мільйони разів, показує, що є найпоширенішими помилками та які найпоширеніші виправлення.
Таким чином Google може практично миттєво запропонувати виправлення орфографії на будь-якій мові.
Також це означає, що якщо протягом ночі всі почнуть писати ніч, оскільки "nigth" google запропонував би це слово замість цього.
EDIT
@ThomasRutter: Дуглас описує це як "статистичне машинне навчання".
Вони знають, хто виправляє запит, тому що вони знають, який запит надходить від користувача (використовуючи файли cookie)
Якщо користувачі виконують запит, і лише 10% користувачів натискають на результат, а 90% повертається назад і вводить інший запит (з виправленим словом), і цього разу 90% натискає на результат, то вони знають, що знайшли виправлення.
Вони також можуть знати, чи це "пов'язані" запити двох різних, оскільки вони мають інформацію про всі посилання, які вони показують.
Крім того, вони тепер включають контекст у перевірку орфографії, тому вони можуть навіть запропонувати інше слово залежно від контексту.
Дивіться цю демонстрацію хвилі Google (@ 44m 06s), яка показує, як контекст враховується для автоматичного виправлення написання.
Тут пояснено, як працює ця обробка природних мов.
І, нарешті, ось дивовижна демонстрація того, що можна зробити, додавши до суміші автоматичний машинний переклад (@ 1h 12m 47s).
До відео додані якорі хвилин і секунд, щоб перейти безпосередньо до вмісту, якщо вони не працюють, спробуйте перезавантажити сторінку або прокрутити вручну до позначки.