Інший веб-сайт є дзеркальним відображенням і займає вище мого сайту в результатах пошуку


55

Існує сайт поганої репутації, відомий як thedirty, який повністю відобразив мій сайт і тепер має посилання, що з’являються в Google на місці №1 з використанням мого вмісту. Я перевірив свої файли журналів і помітив, що цей сайт колись сканує мою, а також має 10 000 посилань з їхнього сайту на мій.

Я заблокував доступ користувачів, на який посилається цей сайт, і вже повідомив про них як веб-спам до Google. Я також відкликав домен.

Як вони отримують найпопулярніші посилання в Google (навіть наздоганяючи мою) для такої нечесної тактики? Які кроки до повного усунення такої проблеми, як ця?

ОНОВЛЕННЯ 28.08.2014:

Я думав, що надам оновлення щодо цього, оскільки зараз у мене є додаткова інформація. Тож тридцять вказали свої субдомени на мій ip, що призвело до того, щоб їхні піддомени виглядали як мій веб-сайт.

Пару днів це мало мало значення, тому що, використовуючи htaccess, я перенаправляв усі HOSTS не з мого домену, назад до мого домену, що в основному означало, що я отримую їх посилання на трафік субдоменів у Google. Через пару днів двадцять змінили свої піддомени, щоб повернутись на свій веб-сайт, щоб я більше не користувався цим.

Отже, вся справа в тому, що вони використовували мій вміст, щоб отримати найкращі рейтинги в Google, і тепер спрямовують ці посилання на свій веб-сайт, щоб збільшити більше трафіку на їхній.

Це брудна тактика брудного веб-сайту. Я сподіваюся, що Google карає таку поведінку.


3
Я відредагував ту частину, де ви ставите під сумнів їхній мотив, як це поза темою. Але добре питання інакше.
Джон Конде

1
Клонування веб-сайтів, здається, є новим трюком, на даний момент багато веб-сайтів зловживаються. На цю тему є новини на Heise (німецька). Звичайним рішенням (окрім повідомлення про підроблений сайт) є подання спеціального вмісту на IP-адреси сканерів, тому вони, наприклад, показують посилання на ваш реальний сайт.
martinstoeckli

1
Ще одна стурбованість за майбутнє - тепер, коли Google зайняла таку жорстку позицію щодо веб-спаму, - це те, що конкуренти навмисно розмістять мій вміст на сайтах із поганою репутацією, щоб пошкодити мою репутацію. Або розміщуватимуть спаммі, що шукають блоги, що вказують на мій сайт без мого відома.
Marlboro Goodluck

3
@Jarrod Roberson: насправді ніхто не знає про позов, але скільки про технічне рішення ?!
машинобудівний вирок

1
@JarrodRoberson Тим не менш, це проблема, з якою стикаються виключно веб-майстри, і тому дуже актуальна для цього веб-сайту, тому що запитуючи його тут, ви отримаєте відповіді від людей, які також мали справу з цим. Схоже, люди подали кілька технічних рішень поряд із юридичними.
подяка

Відповіді:


45

Якщо вони просто відображають ваш сайт, подаючи його через проксі-скрипт або повторно регулюючи ваш HTML-вербатум, ви можете додавати канонічні URL-адреси на свої сторінки. Це дозволить Google дізнатися, що ваш вміст є оригінальним джерелом та покаже вашу URL-адресу в результатах пошуку, а не їх.

Надішліть запит на захист DMCA в Google. Вони з ними трохи повільно, але в кінцевому рахунку вони видалять ці сторінки з їх індексу.

Відкликання посилань - розумний хід.

Не знаю, чи корисне блокування користувачів. Можливо, розміщення повідомлення вгорі ваших сторінок для того, щоб вони повідомили, що ви оригінальний сайт, а інше є шахрайством, можливо, буде кращим рішенням.


2
Канонічні URL-адреси не завжди допомагають. Сценарій, який відображав мій сайт, змінив канонічну URL-адресу, щоб вказати і на підроблений сайт; тож було безглуздо.
CaptainCodeman

28

Ви можете подати скаргу на захист DMCA, і якщо ви перебуваєте в США, ви можете подати позов про цивільне законодавство про авторські права.

Ось посилання на коротку відповідь, що пояснює, як скарга DMCA може допомогти будь-кому:

Чи потрібно вам бути в Сполучених Штатах, щоб подати скаргу на захист DMCA?

... і ще одне пояснює більше ...

Скільки вашого вмісту потрібно скопіювати, щоб ви могли подати скаргу на захист DMCA?

Якщо ви перебуваєте в США, ви можете найняти адвоката, який знайомий з проблемами авторського права, і надіслати їм лист про припинення та відмову. Дайте їм 10 днів (реальні, а не робочі дні, хоча робочі дні теж будуть непогані) для видалення вмісту. Ви також хочете зробити знімки оскаржувального сайту для ваших доказів та оснащення вашого сайту. Якщо ви перевіряєте, чи була видалена сторінка, перевірте сайт безпосередньо, а не результати пошуку.

Якщо сторінку не було видалено протягом періоду часу, ви можете подати федеральну цивільну справу, яка потребуватиме щонайменше 10 000 доларів США на захист і навряд чи коштуватиме вам нічого. Ви будете на водійському місці. Цілком ймовірно, що врегулювання може мати принаймні 10 000 доларів США, а можливо і більше. Ви також можете повернути свої витрати. Важливо - запропонувати недорогий варіант виправлення проблеми, отже, повідомлення про припинення та відмову. Після цього вам зрозуміло, що ви можете подати справу до відповідача без відповідальності.

Ще одна примітка полягає в тому, що вам потрібно буде продемонструвати шкоду, якщо ви звернетесь до суду. Втрата пошукового трафіку - це збитки. Тут ви будете працювати зі своїм адвокатом для збору показників, які ілюструють втрату трафіку, і вам потрібно буде монетизувати вартість цього трафіку. Звичайно, ви можете припустити більш високі показники тут навіть при 100% конверсії. На всякий випадок я збираю сьогодні показники щодо втрат трафіку за допомогою Google Analytics та програмного забезпечення для аналізу ваших журналів сьогодні та в майбутнє.

Будь ласка, знайте, що подання справи не є складною або дуже дорогою, особливо порівняно зі збитками, які ви зазнаєте зараз і в майбутньому. Порушення авторських прав останнім часом зменшуються, але ті, хто порушує авторські права, набагато сміливіші. Нам потрібно зупинити цих людей, і єдиний реальний спосіб - це вкласти фактор витрат у бізнес-стратегію, яка робить порушення авторських прав невигідним.


2
Вся проблема, яку ви стоїте в стороні, полягає в тому, що виявити, хто стоїть за сайтом, практично неможливо. Я маю на увазі, вони повинні бути ідіотами, щоб легко простежити сайт назад до фактичної особи.
Девід Малдер

1
@DavidMulder Немає бокових кроків. Адвокат може винести в суд компанії, за необхідну інформацію. Навіть доброго листа досить. Якщо інформація не надана, то адвокат може вимагати подання до суду перед суддею зі стягненням в'язниці, якщо вони не з’являться, або надати запитувану інформацію. У США немає приховування від закону - цивільного чи іншого. Це все ще працює на міжнародному рівні за деяким винятком.
closetnoc

@closetnoc: Компанія може не бажати надавати інформацію вільно або навіть мати можливість це зробити. Безперечно, що суд винесе повістку в суд або що слід залишатиметься під його юрисдикцією. Ви можете опинитися в дуже дорогому і тривалому юридичному бою з третьою стороною, яка може навіть не знати справжнього імені правопорушника. Судячи з вашої ретельної відповіді, ви неоднозначно знаєте про ці перешкоди, але я маю сторони з Девідом Малдером: я думаю, ви розумієте, як важко простежити сайт назад до людини.
Маркс Томас

@closetnoc: Так, за винятком того, що хостинг-провайдер не має правильної інформації. А оплата, ймовірно, здійснювалася за допомогою передплаченої кредитної картки чи якоїсь іншої передплаченої картки, викраденої кредитної картки, біткойна чи якогось іншого механізму транзакцій, що не можна відстежувати. О, і хостинг-провайдер може навіть не бути в США в першу чергу. Це називається Інтернет, подобається він чи ні.
Девід Малдер

@DavidMulder Я ціную те, що ти говориш. Я займаюся охороною, особливо в галузі досліджень, як знайти поганих хлопців. Переважно з того, про що ви говорите, було б китайське, російське чи польське. Але все ж є способи визначити, хто ці люди через закономірності та подібні. Вони віддають себе. Це саме те, що я роблю. Ви повинні спробувати. Ви не можете просто перевертати. Хороший Інтернет-юрист знає таких людей, як я, і як отримати інформацію. Одна нитка - це все, що мені потрібно, і я зазвичай її отримую. Але це може бути справжнім зусиллям. Але це найгірший варіант сценарію.
closetnoc

27

Ви можете відслідковувати їхні IP-адреси (або IP-адреси) та повертати їм абсолютно інший вміст у дзеркальне відображення - все, що завгодно. Таким чином ви отримуєте вільний простір для реклами будь-якого, і ви можете використовувати їх високу позицію в Google на вашу користь.

Я колись використовував це, щоб просто пояснити користувачам на дзеркальному веб-сайті, що це неправильний домен. Ви також можете опублікувати простий заголовок перенаправлення HTTP.


8
Я насправді чомусь вважаю це досить смішним. +1
Мехрдад

1
вони, ймовірно, не будуть клонувати заголовки HTTP, але ви можете надсилати їм анімацію javascript та смішні банери у стилі Marquee, які кричать «це рипофф» та старі добрі анімовані gif-файли: P
Флоріан Фіда,

також можна використовувати метатеги та переадресації JavaScript, одна з трьох майже напевно спрацює. у будь-якому випадку, це не є стабільним рішенням і працюватиме лише до тих пір, поки вони не з’ясують і не почнуть працювати проти цього. @Mehrdad, я думаю, це смішно, тому що це хакі :)
Ігор R

мені також здалося, що це смішно, тому що зловмисник фактично відкриває вразливість на собі, пускаючи жертву на свою (зловмисну) майданчик, навіть якщо він може її зупинити в будь-який час. що робить зловмисника досить дурним.
Ігор R

Їх висока позиція в Google замінює високу позицію оригінального веб-сайту, тому це насправді не «безкоштовна реклама».
CaptainCodeman

12

Трохи запізнення для вас, але найкращою ідеєю захисту вашого веб-сайту (у майбутньому) було б таке: https://www.youtube.com/watch?v=I3pNLB3Cq24 (defcon 21, захист за номерами), підробка коду повернення, щоб користувачі буде бачити вміст, але боти будуть

  • викинути вміст
  • повзати по колах
  • перестань працювати

інші можливі ідеї - переконайтесь, що ваші користувачі нічого із цього не бачать:

  • нехай вони зберігають ГБ інформації (на вашому сервері лише кілька кбіт)
  • змусити ботів залити власну пам’ять фальшивими посиланнями
  • надсилайте підроблений вміст (100% болш * т - вам потрібно писати речі - наприклад, "Обама вагітна", "Людина-павук 5 - наступного літа", ... щоб ваші злодії могли приймати його ...)
  • надсилайте підроблені файли (наприклад, 42.zip, якщо вони не перевіряють скопійований вміст, його користувачі розважатимуться -> AV-інструменти покажуть, що щось не так -> користувачі будуть p * ss * d ...)
  • нехай вони чекають додаткових даних (розмір файлу = 1-10 Мб і надсилають випадкові кр * р з 1 байт / с або менше)

інші ідеї:

  • посилання, захищені Javascript (старі, більше не використовуються? але якщо вони залишаться незмінними, користувачі надішлють вам (на деякий час))
  • динамічне сміття (використовуйте коментарі чи невидимі предмети, щоб боти завантажували речі, які користувачі не бачать - хороші боти для цього не потраплять)
  • block ip звертає увагу на те, що завантажувати занадто швидко / занадто швидко / неправильно (боти не ведуть себе як люди 1) кожне посилання на кожній сторінці 2) є шаблон або повний хаос у способі вибору наступного посилання)
  • використовуйте Javascript для переадресації на ваш сервер, якщо файли не розміщені на вашому сервері (не допоможе проти крадіжок, але злодії повинні його видалити або їхні користувачі не залишаться на своїй сторінці - ви можете зашифрувати це в різні підпрограми (наприклад, розшифровка вмісту ))

У мене є власний код, який мені ще потрібно налаштувати, який блокує павуків. Я буду розбиратися у ваших ідеях, тому що такий я хлопець! ;-) Чудові поради!
closetnoc

4
Проблема з блокуванням павуків і ботів полягає в тому, що ви, мабуть, не хочете, щоб усі вони були заблоковані. Наприклад, Google дуже важливий, якщо ви хочете, щоб люди могли знайти ваш веб-сайт. (Оскільки Google має ваш сайт у своєму кеші, веб-сканеру насправді не потрібно сканувати ваш сайт, щоб його дублювати).
trlkly

Якщо ви збираєтесь навмисно дати їм щось по черзі - я вважаю за краще відповідь Ігоря зробити це корисним для вас (перенаправити / сказати, що це неправильно / розміщення реклами), а не відбиватися.
OJFord

2

Це називається Google Proxy Hack, і це трапилося і зі мною.

Насамперед:

  • Надішліть скаргу DMCA на веб-хост. Скористайтеся цим посиланням, щоб створити правильно сформовану скаргу та надішліть її на електронну адресу підтримки або зловживань. Якщо хост знаходиться в США, він повинен зняти сайт. Навіть якщо вони не знаходяться в США, вони все одно можуть вирішити зняти сайт. (Це сталося зі мною одного разу.)
  • Використовуйте інструмент Google DMCA, щоб попросити видалити дзеркальну URL-адресу з її результатів пошуку.
  • Використовуйте звіт про скрепер Google, щоб повідомити про помилку в алгоритмі Google.

По суті, з боку Google це невдача. При всьому, що вони говорять про те, що рейтинг базується на "якісному оригінальному контенті", це абсурдно простий зустрічний приклад, який, відверто кажучи, просто бентежить.

Сподіваємось, що якщо достатньо людей скаржиться на це, зрештою, Google зійде разом і напише 10 рядків коду, необхідних для перевірки того, що сайт є точно дзеркалом раніше створеного сайту.

Також майте на увазі, що використання канонічних URL-адрес не завжди працює в цьому випадку. Багато з цих проксі-скриптів змінюють канонічні URL-адреси, щоб вказувати на дзеркальний сайт, тим самим роблячи їх марними.

Нарешті, пам’ятайте, що вони, можливо, також спамували ваш основний сайт зі сміттєвими посиланнями, щоб пошкодити ваш рейтинг. (Це трапилося і зі мною.)

Якщо ви займаєтесь пошуком і творчим мисленням, є кілька способів дати відсіч. Я дійсно не думаю, що опублікувати повний список тут не годиться, оскільки це просто полегшує життя хакерів.


1

Як і інші згадували, подання скарги щодо закону про захист авторських прав у цифрову епоху та порушення цивільно-правового позову щодо авторських прав можуть бути найкращими варіантами.

Щодо нового вмісту, який ви публікуєте, ви можете розглянути повідомлення про оновлення свого веб-сайту у соціальних мережах (Twitter, Facebook тощо), як тільки ви публікуєте повідомлення. Зазначена там мітка часу може бути справедливим показником, який ви написали першим, якщо вам доведеться це довести. За допомогою Інструментів Google для веб-майстрів ви можете застосувати налаштування, щоб Googlebot часто сканував ваш сайт . Припускаючи, що популярні пошукові системи регулярно індексують ваші веб-сторінки (використовуйте оператор сайту, сайт: example.com, щоб дізнатися це), дата в кешованій копії може використовуватися як приблизний показник часу публікації вмісту.

Крім того, для нового вмісту, який ви публікуєте, ви можете вставляти водяні знаки у зображення та розміщувати коментарі у файлах JS, що вказує на те, що ви є початковим власником цих файлів.


Якщо бот копіює вміст, він може просто включити інформацію про авторство на сторінку, тому скопійований вміст міститиме щось на кшталт "Це створено Foo, усі права захищені", що робить дійсно зрозумілий випадок (можна, наприклад, приховати. що в акростичному, але, будучи ботом, він буде працювати в простому тексті, і зробить вашу справу сильнішою).
Ángel
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.