Запобігання пошуку зворотних пошукових систем у пошуку походження вашого зображення?


15

Я планую зробити гру, де я даю користувачеві зображення, пов'язане з аніме, і вони повинні здогадатися, звідки його.

Однак більшість зображень, спеціально з популярних аніме, є простими у використанні в зворотному пошуку Google, щоб знайти та вказати аніме.

Я намагався зрозуміти, чи зможу я зробити так, щоб він не розпізнавав зображення, але, на жаль, мої трюки були недостатньо хорошими.

Оригінальне зображення:

Оригінальне зображення

Сіра гама з горизонтальним відкидом:

Сіра гама з горизонтальним фліпом

Водяний маркування:

Водяний маркування

Спантеличення зображення сірою гамою:

Спантеличення зображення сірою гамою

Для цього зображення працювала сіра шкала з горизонтальним і вертикальним фліп, але не завжди працює:

Сіра гама з горизонтальним і вертикальним відкидом

Також вищезгадані методи люди досить легко здогадуються про аніме.

Мені хотілося б знати, чи є якийсь хороший трюк, який я міг би використати на своїх зображеннях, щоб це не працювало в пошукових системах зворотного зв’язку і все ж не було настільки складним, що я можу реалізувати у своїй програмі.

Наприклад, сіра гамма, обрізка, гортання - це досить прості речі, які можна досягти в C #.


3
Мені подобається ідея спантеличити зображення для додаткових труднощів. Однак якщо хтось по-справжньому хоче грати у вашу гру, у мене виникають проблеми з розумінням того, як зворотний пошук Google буде проблемою для гравців, чи грають дуелі, хто їх знайде першим? Мені б більше непокоїти наявність ліцензійних прав на зображення, якщо ви плануєте продавати свою гру.
цікаво

2
@Emilie Так, існує система щотижневого та щомісячного ранжирування, і лише перша відповідь відповідає рівню отримання балів за конкретний образ. Це не гра, яка продаватиметься , а оригінальний образ буде вказуватися митцям із належними правами. Це скоріше щось дуже просте, що я хотів додати до нашого чату.
Приз

1
Проблема полягає в тому, що пошук зворотного зображення повинен бути в змозі обійти пошкодження зображення або його не дуже хорошого, так що ваш бойовий фундаментальний технологій і ви остаточно втратите.
joojaa

4
Спроба захистити цифрові засоби масової інформації від піратства або будь-яке завдання в цій лінійці, швидше за все, закінчиться, якщо ви не зможете зіпсувати нечесних людей і зіпсувати досвід для чесних користувачів. Іноді доводиться робити такий компроміс.
GiantCowFilms

1
Зупиніться на цьому. Надання кредиту - не отримання дозволу на використання зображення. Це авторські матеріали. Якщо ваша гра обдурить пошук, вона, ймовірно, не переживе розслідування щодо порушення інтелектуальної власності. Не продовжуйте, не отримуючи письмового дозволу власників авторських прав на "ВИКОРИСТАННЯ ЇХ ІНТЕЛЕКТУАЛЬНОЇ ВЛАСНОСТІ". Ви можете бути приємно здивовані, виявивши, що вони дають вам дозвіл, виходячи з призначеного для гри гри. Не вгадайте. Не сподівайся. Дізнайтеся, перш ніж докласти більше зусиль для свого дива.
Стен

Відповіді:


9

Я думаю, що ви були на правильному шляху з вашим варіантом водного маркування, але ви залишили занадто багато оригінального зображення в такт. Ось два зображення, які я намагався знайти Google:

Шашка

введіть тут опис зображення
Зворотні результати пошуку зображень

Мозаїка

введіть тут опис зображення
Зворотні результати пошуку зображень

Ще один приклад

введіть тут опис зображення
Зворотні результати пошуку зображень

Перше зображення повертає безліч результатів "картатого прапора", а друге повертає безліч зображень мозаїки / колажу. Розмір має значення! Я спочатку спробував це з набагато меншим шаблоном шахівниці (16 пікселів); Google все ще зміг це визначити. Ці квадрати розміром 32 пікселів здаються щасливим середовищем.

Виходячи з інформації, яку надав DanS, я думаю, що це була б надійною методикою обдурити Google (і легко автоматизуватись!). Я можу лише припустити, що хтось, хто зміг ідентифікувати це аніме, все-таки зможе зробити це з цих зображень.


За іронією долі, створені нами зображення в кінцевому підсумку будуть індексуватися Google і призведуть до цієї публікації, перемігши мету!


1
Ось що я закінчив робити з невеликою різницею, що я більше не створюю регулярних форм, таких як квадрати, це, здається, працює в хорошій мірі, і так, в якийсь момент він буде індексуватися, але до цього часу у нас з’являться нові зображення відповіді, які вже відповіли, не повертаються до черги. Дякуємо, що знайшли час.
Приз

2
Ще більше іронії. Можливо, ви дали Google підказку щодо того, що поліпшити.
joojaa

9

Google може використовувати іншу систему, але велика кількість таких служб (включено в них) використовують перцептивні хеші, коли загальний хеш достатньо близький, а не точний.

Кілька років тому з'явилася довідка, яка детально описала процес. Я не зміг знайти посилання на нього, але основна система спирається на ланцюжок дій для створення хешей.

  • Зменшіть зображення до невеликого масштабу, як правило, 32x32 або 64x64
  • Перетворіть зображення у відтінки сірого
  • Збільшити контраст до заздалегідь заданого значення, щоб забезпечити високий рівень різниці між чорними та білими тонами
  • Обчисліть pHash з пікселів на отриманому зображенні

Процес буде повторюватись для будь-якого завантаженого зображення, а потім перехрещувати з індексованими хешами, щоб знайти будь-які близькі збіги. Коротше кажучи, зображення потрібно різко змінити на великі порції, щоб обдурити будь-яку подібну систему.


Дещо цікавої інформації там, я хотів би перевірити статтю.
Prix

2

Просто створіть негативне зображення оригіналу та оберніть його назад css. Користувач побачить зображення як звичайне, однакової якості, але при завантаженні воно перевернене.

.myImageClass {

 filter: invert(100%);

}

Негативне зображення не буде відповідати оригіналу (результат пошуку NL):

Приклад пошуку

Крім того, спробувавши це, зменшивши кольори до 256, Paint Shop Pro є королем у цьому. Зображення безпосередньо не відповідатиме оригіналу. Якщо поєднувати це з вищезазначеним методом, це може бути чудовим.


0

Ви можете зробити щось подібне:

введіть тут опис зображення

Він не є 100% бронезахисним, але він повинен скинути більшість двигунів ідентифікації зображень.

Що я зробив, це додав чорно-білому шуму до зображення, а також деяке зміщення. Возитися з кольорами, наприклад. лише зміщення одного або двох кольорових каналів було б ще ефективнішим, але складним у здійсненні.


1
Я спробую спробувати кілька популярних зображень і побачу, як це в кінцевому підсумку зараз, я зійшов у закриту головоломку, де відкриваю квадрати, коли даються неправильні відповіді. Таким чином, ви бачите зображення лише кожні X пікселів у той час, який, здавалося, працював досі.
Приз

Так, це не працює, якщо ви не вистачите достатньо шуму, щоб зробити все зображення невпізнанним, що переможе ціль, яку я маю. Спасибі.
Приз

4
За винятком пошуку в курсі цього зашумленого зображення Google негайно знаходить джерела. Алгоритм, швидше за все, здійснює пошук у просторі Фур'є, і ваш шум не робить для цього багато.
joojaa

@joojaa Yah, я це помітив, але Prix попросив мене показати йому зображення того, що я запропонував як коментар, тому я опублікував відповідь.
GiantCowFilms

@GiantCowFilms Lame, це саме той фільтр, який буде ігнорований при пошуку зображень.
Навін

0

Спробуйте перемкнути формат файлу, який ви зберігаєте. Повернення пошуку зображень починається з використання деяких даних, які входять в систему власне до зображення, імовірно, тому ваші методи обфускування не працюють. JPEG в цьому особливо погані, PNG не так багато. Однак із особливо популярними зображеннями це може не спрацювати.

В ідеалі - знайти спосіб відображення зображення у капсульованому вигляді, з яким користувач не може безпосередньо взаємодіяти (копіювати -> вставляти). На жаль, у мене немає технічних деталей щодо того, як цього можна досягти в даний час, тільки що я помітив, що зображення, використані у Flash / Shockwave, мають це властивість.

По-друге: план у цілому - використання захищених авторським правом зображень, не вимагаючи попередньо відповідних дозволів від їх власників, навіть при умові, що ви надаєте атрибуцію, як тільки головоломка буде вирішена, - ставить вас під загрозу вилучення запиту чи іншого юридичного дії, особливо якщо ви запускаєте гру в будь-якому обсязі. Якщо можливо запустити гру за допомогою fanart (оскільки ви, швидше за все, отримаєте відповідний дозвіл на використання fanart, ніж канонічний вміст), можливо, краще це зробити.


Ніщо з цього не пов'язане з питанням ОП. Я думаю, я трохи запізнююся на вечірку, але: Google не використовує EXIF-дані, і ОП не збирається стикатися з юридичними проблемами, оскільки він неприбутковий.
Навін

0

Ви повинні заплутати пошукову систему.

Найкращий спосіб перемогти автоматизований пошук зображень - це надання альтернативних зображень, які неможливо ідентифікувати чи походити з конфліктуючих джерел, та тих, що плутають вказаний зразок для ідентифікації.

Наприклад, якщо ви надаєте зображення, що складається з трьох зображень у чергуються смуги чи смуги, і просите ідентифікувати зображення, що складається лише з кожної третьої смуги, так що, якщо воно буде виділене з інших смуг, воно буде відображатися як одне зображення з пробілами ( де смуги інших зображень перекриваються).

Людський мозок викликає "Замикання", щоб сприйняти зв'язані зображення в єдине ціле, яке можна ідентифікувати. Ключ є достатньо ідентифікованою, але неактуальною деталлю в іншому зображенні, щоб заплутати двигун.

Питання друге може бути з однаковим зображенням, але запитувати кожну третю смугу, починаючи з другої смуги. Насправді, ви можете використовувати одне зображення з трьома різними компонентами і, отже, трьома різними відповідями.

Автоматизований пошук не може атакувати таку просторову проблему, якщо споріднені смуги фізично не ізольовані від пошуку. Важко зробити.


Це буде дуже прикро, як користувач дивиться
Зах Сосьє,

@ZachSaucier Це має бути як складною грою, так і чимось обійти все більш інтелектуальне програмне забезпечення. Я не можу коментувати інші аспекти. Чим це сильно відрізняється від шахової дошки, наскільки дратує?
Стен

-3

Зупиніться на цьому. Не копіюйте. Використовуйте оригінальні твори мистецтва. РЕДАКТУВАТИ: Ставтесь до цього як до ПІІ.

Копіюючи, ви опосередковано намагаєтесь обійти захист інтелектуальної власності. Ви граєте з вогнем.

Також є вада у вашому обґрунтуванні та міркуванні: Надання кредиту НЕ отримання дозволу на використання зображення . Це не "чи" ситуація. Це авторські матеріали. Не має значення, продається результат для продажу чи ні. Ваш прибуток, фінансовий чи інший, не має наслідків для правопорушення. Навіть якби проект був для академічних чи наукових досліджень, вам знадобиться дозвіл власників авторських прав, не наданих їм кредитів.

Якщо ваша гра обдурить пошук, вона, ймовірно, не витримає вмотивованого юриста, який проводить розслідування порушення інтелектуальної власності.

Не продовжуйте, не отримуючи письмового дозволу власників авторських прав на "ВИКОРИСТАННЯ ЇХ ІНТЕЛЕКТУАЛЬНОЇ ВЛАСНОСТІ".

Ви можете бути приємно здивовані, дізнавшись, що вони дають вам дозвіл на основі призначеного для гри гри. Ведіть нотатки з датами та ескізами. Якщо ви виявите, що люди, до яких ви звернулися, приймають вашу концепцію, подайте в суд за порушення конфіденційності. (Це передбачає окремий юридичний документ NDA і, ймовірно, більше часу, ніж це варто.)

Не вгадайте. Не сподівайся. Дізнайтеся, перш ніж докласти більше зусиль для свого дива. Можливо, буде простіше сказати, що ви шкодуєте, ніж просити дозволу, але спосіб законний, етичний та корисніший.


3
Це не прагне відповісти на запитання. Краще скоротити і зробити коментар
Зак Сосьє
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.