Чи було зламано / зламано reCaptcha / OCR'd / переможений / зламаний? [зачинено]


172

Чи використовувались якісь методи програмування, щоб перемогти reCAPTCHA?

Мені цікаво бачити докази та потенційно демонструвати, що зокрема RECAPTCHA була застаріла повністю автоматизованими безлюдними методами.

Для уточнення, не шукаючи рішення, що стосується рекаптчі-обману, що жодним чином залучає людей, чи то команди, які мають завдання заповнювати CAPCHA, порно-шукачів, чи механічних турків.

Я також не шукаю альтернатив для reCAPTCHA, наприклад, вибору типу тварини або фонових полів або хитрості javascript.


18
кількість дезінформації у цих відповідях ВАМОВА. Якщо ReCaptcha був "зламаний", то хтось краще скаже Facebook, Craigslist та TicketMaster, stat! : p
Джефф Етвуд

15
Джефф, їм сказали, і єдиною дезінформацією є посилання на CAPTCHA як дійсний механізм захисту. Він був емпірично розбитий, як у загальних реалізаціях І теоретично (не просто reCAPTCHA, а сама концепція CAPTCHA). З іншого боку, його НЕ ПОТРЕБНО цінність, я фактично назвав цей самий сайт справжньою справою використання для CAPTCHA - крім багатьох інших механізмів, він може працювати разом, щоб трохи коштувати "нападникам". більше.
AviD

13
Я розчарований тим, що суб'єкт не має pwnedв ньому
skaffman

2
Ще кілька досліджень на тему: schneier.com/blog/archives/2010/10/analyzing_captc.html . Насправді я вважаю коментарі цікавішими, ніж публікація чи саме дослідження ...
AviD

9
Оо! Краща CAPTCHA коли-небудь! xkcd.com/810
AviD

Відповіді:


92

Я зауважую, що майже всі відповіді тут стосуються неефективності концепції CAPTCHA, в принципі - і хоча я дуже з ними погоджуюся, насправді кілька місяців тому він говорив в OWASP, пояснюючи саме це - питання дуже конкретне , тому я забезпечу демонстрацію.
Але спочатку я повторю цю демонстрацію в сторону, перечитаю інші коментарі, оскільки це правда, що CAPTCHA є безглуздим і не корисним, не має значення для впровадження ....

Але дійсно, перевірити CAPTCHA Killer . Ви можете завантажити CAPTCHA-зображення, і воно автоматично, якщо не відразу, надасть відповідь OCR. Він також передбачає API (REST, я думаю, але, можливо, і SOAP). Я особисто спробував численні образи reCAPTCHA, і насправді деякі з найпростіших (або принаймні швидких) були зламані.

ОНОВЛЕННЯ : Веб-сайт CAPTCHA Killer зараз знятий, очевидно, під законним тиском. Повний огляд теми див. На веб-сайті http://captcha.org/ .

І так, OCR - не найкращий спосіб зламати захищений сайт CAPTCHA - є багато інших кращих способів.


3
Цікаво, як працює вбивця капчу. Якось мені здається, що це використання дешевої робочої сили та заробіток за допомогою реклами на веб-сайті. (І мерчандайзинг.)
Георг Шоллі

3
Корисна відповідь про капчі взагалі, але питання стосувалося конкретно reCAPTCHA.
Майк

2
Щойно спробував Captcha Killer з трьома reCAPTCHA. Усі три строки минули, не повертаючи відповіді.
lfaraone

21
Вбивця CAPTCHA, схоже, був убитий: його жорстоко знищили багатонаціональні корпорації, які прагнуть поширити своє панування та усунути свободу творчого самовираження! Такий прекрасний вбивця, така рання смерть!
Кирило

4
Я думаю, що його просто зміна домену і версія стане платною зараз, перевірте це bypasscaptcha.com/captchakiller.php
MarmiK

54

Можливо, вас зацікавить цей детальний звіт про те, як 4chan переміг reCAPTCHA і використовував його для маніпулювання щорічними результатами опитування Time.com TIME 100 .

Злом Recaptcha (він же "Потоп пеніса")

Наступною тактикою було встановити, чи зможуть вони виявити недолік у реалізації reCAPTCHA. Одне, що вони виявили про reCAPTCHA, - це те, що він завжди представляє користувачеві два слова для розшифровки - одне слово є контрольним словом, відомим системою reCAPTCHA, а інше - невідомим словом (reCAPTCHA використовує людину, щоб виправити помилки OCR). Вікіпедія описує процес: “Сканований текст піддається аналізу двома різними програмами оптичного розпізнавання символів; у випадках, коли програми не згодні, сумнівне слово перетворюється на CAPTCHA. Слово відображається разом із уже відомим контрольним словом і позначається людиною. Ті слова, які послідовно дають одну етикетку людськими суддями, переробляються як контрольні слова ». 2iasdo4 Анонім зрозумів, що якби вони завжди маркували невідомий відсканований текст одним і тим же словом - і якщо вони це зробили тисячі і тисячі разів, врешті-решт великий відсоток невідомих слів був би неправильно позначений їх словом. Все, що вони повинні були зробити, це подивитися на два слова в капчу, ввести належну мітку для "легкої" (імовірно, це буде та, з якою погодиться два оптичні сканери) та ввести слово "пеніс" для важкий. Якщо вони робили це досить часто, то незабаром значний відсоток зображень буде позначений як "пеніс", а здатність до автоматичного голосування буде відновлена ​​(один побічний ефект, який не втрачено на "Анонім", - це уявлення про те, що на довгі роки У тексті з'явиться ряд цифрових книг, у яких випадково вставлене слово "пеніс". Оновлення: я попросив Бена Морера,

Оптимізація reCAPTCHA

Настільки ж привабливим, як поняття про розповсюдження слова "пеніс" текстами, команда Anonymous знала, що годинник тикає, і якщо вони збираються відновити Повідомлення, вони не встигли чекати, коли автовози повернуться в Інтернет - вони повинні були голосувати вручну, багато, багато разів. І тому їм потрібно було вводити капчу якнайшвидше. Вони розробили набір вказівок, які дозволили їм швидко вирішити, які слова RECAPTCHA можна пропустити. Наприклад:

Вам дадуть 2 слова: 1 справжній, 1 підроблений.

Для [REAL FAKE]або [FAKE REAL]ви можете просто ввести, REALі це слід прийняти.

Якщо це [LOOKSREAL LOOKSREAL]або [LOOKSFAKE LOOKSFAKE]це, як правило , тільки швидше за все типу в обох словах. Не витрачайте дорогоцінний час, вирішуючи, який з них справжній.

Використовуйте як зовнішній вигляд, так і тип слова, щоб визначити підроблене слово. Не покладайтеся лише на одну з них.

Весь набір правил тут: підроблені капчу .


4
Але хіба не сенс цієї історії в тому, що вони не зламали reCAPTCHA? Натомість їм вдалося впорядкувати процес ручного голосування, щоб дозволити рішучим волонтерам голосувати тисячі разів кожен.
pdc

4
@pdc, тільки тому, що вони не OCR зображень (хоча це теж могло бути зроблено), не означає, що вони не зламали reCAPTCHA. Подумайте про це так: чи є метою RECAPTCHA представити нерозбірливі зображення? Або це для запобігання автоматизованого затоплення? Якщо це перше, ви, можливо, зможете стверджувати, що він не був порушений (спірний, але я б не погодився з вами), але якщо його другий - то у вас є емпіричний доказ того, що reCAPTCHA не працює. Я також думаю, що повинно бути цілком зрозуміло, що окрім розважальної цінності, ціль ДРУГО є справжньою, і тільки такою, яка враховує.
AviD

@AviD Так? Відповідно до статті, автоматичне затоплення було вже неможливим. Швидше, віддані люди змогли проголосувати в кілька разів швидше, ніж могли б інакше (і різні методи, не пов'язані з каптажем, використовувались для запобігання неефективних заходів проти такого важкого голосування людьми). По суті, еквівалентно використанню дешевої людської робочої сили, що, звичайно, не вимагає припинення.
ToolmakerSteve

@ToolmakerSteve саме в цьому проблема, reCAPTCHA не намагається зупинити справжню проблему. CAPTCHA намагається вирішити неправильну проблему, погано.
AviD

32

Слабкістю систем CAPTCHA є те, що в Китаї люди створюють кімнати, наповнені людьми, єдиним завданням яких є перегляд образу та типу CAPTCHA, який підключається до автоматизованої системи, яка насправді робить спам.

Насправді з цим реально не багато.

Це також набагато дешевше, ніж намагатися розпізнати зображення, OCR тощо на фактичному зображенні (ви можете отримати відповідь на суму нижче $ 0,01 в інший спосіб).


62
Або ще краще, вони захоплюють капчу з вашого веб-сайту і показують його деякому повороту (буквально) як вимогу показувати їм порно.
Пол Томблін

2
Людина ... це розумно (кредит, де належить кредит).
клент

7
Зауважте, що це не робить його неефективним інструментом. Це просто означає, що якщо ваш сайт досить популярний, це може статися. Для інших 99,99% веб-сайтів у світі буде зроблена проста капчча.
Роберт П

1
Чорт, Captcha CodingHorror навіть не змінюється, і не затьмарений, і йому вдається добре виконати роботу!
Роберт П

5
Власне, це не зовсім так. Хоча є приклади цього, FAR дешевше OCR-розтріскувати CAPTCHA. Використання потових магазини, як правило , НЕ економічно доцільні для спамерів.
Єнс Роланд

21

Перш ніж віддаватись тиску використання капчу, розгляньте творчі обходи, такі як поле з написом "Ваші коментарі", яке приховано CSS. Якщо поле введене, запит відкидається сервером. Більшість ботів потраплять за це навіть у тому випадку, якщо все-таки не існує хорошого способу перемогти кімнату, повну недоплачених робітників, що капчу ніколи не допомагає.

ОНОВЛЕННЯ : Просто прочитайте тематичне дослідження, де вилучення CAPTCHA збільшувало коефіцієнт конверсії майже на 10%. Це вказувало б на те, що він досить зламаний, якщо ви втрачаєте 10% своїх потенційних клієнтів просто для фільтрації ботів. Уявіть, що 10% означає для більшості підприємств.


2
Це дуже розумно, але не працює, якщо ви досить популярні. Наприклад, Yahoo або Google ніколи не могли цим скористатися.
дерев

2
Тут питання, чи ваш сайт достатньо цінний для конкретних атак. Більшість - ні, і малі ідіосинкразії принесуть користь.
Девід Торнлі

3
Я б поставив +1 за оновлення повторних втрат на 10% - ДУЖЕ важливий момент. (але я не можу
позначити

2
Існує 2 проблеми "цільова атака" та "випадковий спам". Ваше рішення може зберегти вашу дупу від випадкового спаму, але цілеспрямована атака затопить вашу систему протягом дня.
д-р. зло

1
@dreeves: хіба Google просто не придбав reCAPTCHA?
Прабу

18

Моя улюблена капча - від Microsoft: http://research.microsoft.com/en-us/um/redmond/projects/asirra/

Asirra (Розпізнавання зображень видів тварин для обмеження доступу) - це HIP, який працює, пропонуючи користувачам ідентифікувати фотографії котів та собак. Це завдання складно для комп’ютерів, але наші дослідження користувачів показали, що люди можуть виконувати це швидко та точно. Багато хто навіть думає, що це весело!

Це безкоштовна послуга, і вони мають приклад коду, щоб розпочати роботу.

Цікаво, як довго пройде до того, як він розтріщиться.


1
На жаль, відповідь клетуса вище показує, наскільки така послуга виявиться неефективною в більшій боротьбі зі спамом.
Ерік Форбс

1
мені не вдалося, що один із 4-х разів погано освітлена фотографія померанця може виглядати як кішка :(
Том Андерсон

3
Я склав тест, і мені здається, що я знаю, що я людина. :)
BoltBait

5
Насправді найкращою капчу раніше було HotCaptcha - але її офлайн останній раз я перевіряв. На основі HotOrNot.com, це не було жахливо ефективним, але ДУЖЕ популярним серед користувачів :-)
AviD

2
Проблема тут полягає в тому, що грубою силою було б дуже легко через невеликий простір ключів. Якщо yuo почне додавати більше об'єктів до імені, то ви наштовхуєтесь на неоднозначність (наприклад, це Кенгуру, Джої чи немовля Кенгуру?). Вам потрібно переконатися, що у вас є відношення між багатьма названими об'єктами та їх можливими іменами.
Ооранг

11

reCAPTACHA не порушена, і це не буде дуже довго. Річ у тім, що якщо ви реалізуєте власну капчу, якщо вона зламана, це, ймовірно, потребує багато часу, щоб виправити її.

Це взято зі сторінки про безпеку reCAPTCHA :

reCAPTCHA - веб-сервіс. Це означає, що всі зображення генеруються та оцінюються нашими серверами. (...) це також забезпечує додатковий рівень захисту: наші CAPTCHA можна автоматично оновлювати, коли буде виявлена ​​вразливість безпеки.

Наприклад, якщо хтось пише програму, яка може читати наші спотворені зображення, ми можемо додати більше спотворень за дуже мало часу, і без веб-майстрів не потрібно нічого змінювати на своїй стороні.

Я вважаю, що вони спеціалізуються на капчах, вони мають вдосконалені версії, які зберігаються, готові до розгортання за невеликий час, якщо потрібно. (Чому вони повинні створювати більш міцну безпеку, коли слабший ще не зламаний?)


9

Він не тільки зазнав поразки, але і корисний додаток було успішно побудовано поверх нього, щоб стати найдивовижнішим інструментом для перемоги над усіма видами захисту безкоштовних акаунтів великого списку сайтів із прямими завантаженнями (не лише мегазавантаження та rapidshare ).

Jdownloader з відкритим кодом та написаний на Java, тому зазирнути у вихідний код може відповісти не лише на те, чи він порушений, але й як .

Редагувати : Більшість сайтів прямого завантаження використовують не reCaptcha, а простіший метод Captcha (3 великі літери, пофарбовані в різні кольори). Тим не менш, Jdownloader і Cryptload (програма, схожа на Jdownloader) - це єдині працюючі реалізації, які мені відомо, що фактично порушили метод Captcha. Я не чув жодної реалізації, щоб зламати reCaptcha.

Оновлення : Здається, що принаймні одна реалізація reCaptcha (не вся сама reCaptcha) теж зламалася .

Оновлення грудня 2010 року : Jdownloader , нарешті, перемагає функцію reCaptcha . Плагін все ще експериментальний і працює лише на версіях Windows Jdownloader, але, як мені розповів товариш, який його випробував, він працює.


2
Чи знаєте ви, хто з цих файлестерів використовує RE-captcha, тому що rapidshare та megaupload не роблять.
д-р. зло

@ dr.evil він охоплював перелік хостерів майже все, що ми можемо сказати, оскільки цей список містив багато, про які мингт не чули жодного разу, програма була достатньо розумною, щоб зламати більшість капчу, і якщо ні, то це спонукало користувача до те саме, хіба це не корисно. Я раніше це особисто використовував. Це був один з найкращих завантажувачів, в деяких випадках кращий за IDM, Зверніть увагу: Я не промоутер jDownloader. Дякую
MarmiK

8

Було виступ на Defcon в минулому році , що вступила в проблеми з капчі в цілому. Одна з речей, що вони зробили - це використання декількох безкоштовних двигунів OCR, і вони змусили їх проголосувати за найкращі слова. Роблячи це, вони змогли досягти дещо пристойних шансів на успіх. Для одного виду це було 40% або близько того, я не думаю, що це було повторно.


3
Це важливий момент, спам-бот не повинен ламати всі каптаси - 1% зробить це, якщо він може продовжувати спроби.
Мартін Бекетт

8
  • «Насправді, це [рекапчі] стало марно на 4 січня [2011] , коли спамери , мабуть , отримали свої колективні руки на шматку програмного забезпечення , що дозволяє обійти рекапчі і дозволяють повністю автоматизований процес реєстрації. Боти був зайнятий, дуже зайнятий , на самому ділі з тих пір " [1]

2-3 роки тому підхід із кепт-тексту, що набирає текст, перевершив лінію, коли вони програли битву, тобто подальші ускладнення просто роблять їх відносно (оскільки потужність комп’ютера зростає, тоді як людина не) легше для машин і більше відверто і відштовхує, якщо ні абсолютно неможливо для людини. Це впливає на оригінальну парадигму CAPTCHA як тест, щоб переконатися, що відповідь не генерується комп'ютером

Оновлення:
Зауважте, що reCAPTCHA належить Google Inc., але Google Inc. не використовує їх власними службами.
Ось посилання, що стосується веб-сторінки з капчу, яку використовує сама Google / внутрішньо, наприклад, для реєстрації в Gmail:

alt текст



Зауважте, що у Google RECAPTCHA завжди є 2 слова.
Ось посилання на зображення з реCAPTCHA Google, запропоновані для використання іншими .

І скріншот reCAPTCHA:

alt текст

Залишаю зробити очевидні висновки читачеві.

Цитовано: [1]
Форуми vBulletin потрапили у reCAPTCHA тріщин спам-бота | Блог PC Pro
Опубліковано 12 січня 2011 року Дейві Віндер


5

Я бачу коментарі в блозі щодо системи, захищеної reCAPTCHA, де сторінка завантажується і через 1 секунду повідомлення було успішно виконано. Користувач-агент був нісенітницею (у цьому конкретному випадку він стверджував, що він працює під керуванням Ubuntu 9.25 / Firefox 3.8), референт був із абсолютно не пов’язаного з нами сайту, не маючи до нас посилання.

Це чітко автоматизовано.


3

reCAPTCHA не зазнав поразки. Якщо так було, то чому Google просто купив його та оголосив, що застосовуватиме технологію в Google, щоб збільшити захист від шахрайства та спаму для продуктів Google?

від Google Acquires reCAPTCHA, розміщений у блозі Google 16.09.09:

Таким чином, унікальна технологія reCAPTCHA покращує процес перетворення сканованих зображень у звичайний текст, відомий як оптичне розпізнавання символів (OCR). Ця технологія також забезпечує широкомасштабні проекти сканування тексту, такі як Google Книги та Пошук новин Google Archive. Наявність текстової версії документів важлива, оскільки звичайний текст можна шукати, легко рендерувати на мобільних пристроях та показувати користувачам із вадами зору. Тож ми застосовуватимемо технологію в Google не тільки для підвищення захисту від шахрайства та захисту від спаму для продуктів Google, а й для покращення процесу сканування книг та газет.


3

Найпростіший спосіб перемогти Captchas - це амазонський механічний турк. Є хлопець на ім’я Керміт Велда, який платить людям по нікелю за реєстрацію облікових записів Hotmail, AOL та Gmail. Це 6000 підроблених акаунтів електронної пошти за 5 центів = 300 доларів на день. Витрати на ведення бізнесу досить дешеві, коли у вас інші люди роблять брудну роботу за вас. Недарма фільтри спаму нашого сервера хочуть відхилити що-небудь з Hotmail.


Це справді відповідь ...?
Остін Генлі

Майте сенс, якесь подібне поняття Death by Captcha .
kenorb

ОП га чітко заявив, що це не те, що він шукає.
Скотт Солмер

2

AFAIK На практиці не існує інструменту, щоб зламати реалізацію RE-captcha, проте, зрештою, я припускаю, що хтось отримає це.

Досить смішно, якщо комусь вдається отримати його, тоді весь проект RE-captcha є безглуздим, оскільки ре-captcha задумав оцифровувати книги, що неможливо зробити автоматизовано.

До речі:

Слабкістю систем CAPTCHA є те, що в Китаї люди створюють кімнати, наповнені людьми, єдиним завданням яких є перегляд образу та типу CAPTCHA, який підключається до автоматизованої системи, яка насправді робить спам.

Ви не можете забезпечити системне мислення таким чином, це сказати, що "ваш веб-додаток недостатньо захищений, якщо ваш хост не знаходиться в старому військовому бункері, тому що тепер люди можуть викрасти вашу машину".


3
Ваші настрої не впізнаються, але застосування їх неправильне: Мислення (коментаря, який ви цитували) полягає в тому, що CAPTCHA не вирішує проблеми, яку він має намір . Або, як я часто говорю, "CAPTCHA (загалом) - це погане рішення неправильної проблеми". Проблему, яку CAPTCHA намагається вирішити (за визначенням), полягає в наступному: як я можу знати, що користувач - це людина, а не комп'ютер? Незалежно від того, чи вирішує це CAPTCHA (це не так), РЕАЛЬНА проблема полягає в тому, як я можу запобігти масовому затопленню моєї послуги? CAPTCHA ферми та проксі-сервери показують точну різницю. Тому будь-яке рішення щодо безпеки повинно починатися із загроз.
AviD

1
Ви маєте рацію, все зійшло "Чому ви використовуєте CAPTCHA?". Для деяких систем достатньо безпеки, для деяких систем це навіть не близько. Але так само, як розмір клавіш у криптовалюті, допомагає вам щось захистити, змушуючи грубі змусити зайняти роки (хоча зрештою вони збираються зламати це! Але не в цей час життя чи не в наступні 10 років) CAPTCHA в деяких системах може допомогти достатньою безпекою в так само. Отже, як ви сказали, все зійшло для чого ви використовуєте CAPTCHA?
д-р. зло

2

Існує безліч методів, які використовуються для того, щоб лайно рекапчувати. Незважаючи на те, що важко використовувати програми, що підтримують нейронну мережу, підтримує їх автоматичне вирішення, можливо захопити зображення та мати механічну тюрк Amazon або якусь еквівалентну програму для їх вирішення.

http://codemagician.wordpress.com/2010/01/22/solving-recaptcha/

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.