Як recaptcha знає, що ви не вводите хибні переклади зображень [закрито]


22

Як я розумію, Captchas - це текст, спотворений застосуванням фільтрів, шуму та інших різноманітних алгоритмів. Тому, щоб з’ясувати, чи здатність людини читати, чи здатність людини читати, ви порівнюєте те, що вони відповіли, з відомою відповіддю.

Тепер, читаючи на ReCaptcha, він говорить, що відображаються слова - це ті, які не можуть бути перекладені OCR. Крім того, для перекладу цих зображень використовується recaptcha. Як можна визначити, чи справді ти прав у своєму читанні чи просто вигадуєш речі?

Якби він знав, що сказано, він би не використовувався в recaptcha як матеріал перекладу. Якщо він не знає, що йдеться в тексті, то як він підтверджує вашу відповідь?

Я здогадуюсь, що це, мабуть, якийсь аналіз, заснований на ймовірності, з величезними розмірами вибірки, перш ніж він позначає що-небудь як перекладене.

Хтось знає, де відповідь на це?


3
Цікавим є 4chan / анонімний розіграш під час опитування Time. "Мармуровий торт, також гра", яка використовувала недоліки в краудсорсинг-верифікації другого слова.
DanBeale

Відповіді:


33

Сторінки книг в основному фотографічно скануються, а потім перетворюються в текст за допомогою "Оптичного розпізнавання символів" (OCR) і подаються в Інтернет у вигляді зображення з одним словом, яке відомо комп'ютерній програмі за reCAPTCHA та одним словом, яке не є ще невідомо.

Потім користувач вводить обидва слова, і якщо вони вирішують те, на яке відома відповідь, система припускає, що їх відповідь є правильним для нового. Потім система дає нове зображення ряду інших людей, щоб з більшою впевненістю визначити, чи була оригінальна відповідь правильною. Тому система - це самовдосконалюється послуга, яка з часом стає кращою.

http://www.google.com/recaptcha/learnmore


22

Ось чому у reCaptcha ви ввели два слова. Одне зі слів уже відоме, а одне зі слів невідоме. Від того, чи будете ви пропустити чи провалити капчу, залежить тільки від того, як ви відповідаєте за відоме слово. Ваша відповідь на інше (невідоме) слово буде використано разом із іншими відповідями на те саме слово, щоб перетворити його на відоме слово.


4
... тому також з часом стає все частіше засмучувати та переконувати, що ти ідіот / робот, коли ти п’ять разів поспіль провалюєшся. :-(
Sirex

Дивно ... Я ніколи не провалював жодного, якого я пам’ятаю, можливо, просто удача з мого боку.
Павло

@Sirex Я думав про це, але потім зрозумів, що це справедливо лише в тому випадку, якщо розмір тексту корпусу є постійним або скорочується відносно кількості записів у каптарі. Правда полягає в тому, що текст корпусу зростає ... питання полягає в тому, чи це зростання йде в ногу зі зростанням використання загальної Captcha.
Joel Coehoorn

так, я здогадуюсь Я бачив безліч reCaptchas, які просто шалено важкі. Де навіть відоме слово неоднозначне.
Сірекс
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.