Як відфільтрувати повідомлення з анімованими смайликами в темі в Gmail?


27

Я котився через папку зі спамом (що я рідко роблю, оскільки Gmail рідко має помилкові позитиви), і я помітив щось цікаве:

зразок списку спам-повідомлень

Щось на зразок понад половини повідомлень містить принаймні одну анімовану смайлику в темі.

Ніхто з моїх друзів не скористався блюдом. Жодна дійсна компанія, з якою я мав би справу, ніколи не зробить цього.

Як я можу створити фільтр для, можливо, автоматичного видалення повідомлень з анімованими смайлами в темі?

Використовуючи підказку jamesmstone нижче, я спробував пошук із subject:=?UTF-8?та subject:"=?UTF-8?"та іншими перестановками, але жодна не працювала.

Ось набір зразків заголовків однієї з таких парів:

Delivered-To: [redacted]@gmail.com
Received: by 10.107.28.200 with SMTP id c191csp1104992ioc;
        Sun, 24 Jan 2016 19:07:16 -0800 (PST)
X-Received: by 10.107.38.5 with SMTP id m5mr15068933iom.15.1453691236564;
        Sun, 24 Jan 2016 19:07:16 -0800 (PST)
Return-Path: <VivaLoan@mythirdxyz.xyz>
Received: from mythirdxyz.xyz ([2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11])
        by mx.google.com with ESMTP id o10si8722554igw.41.2016.01.24.19.07.15
        for <[redacted]@gmail.com>;
        Sun, 24 Jan 2016 19:07:16 -0800 (PST)
Received-SPF: pass (google.com: domain of VivaLoan@mythirdxyz.xyz designates 2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11 as permitted sender) client-ip=2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11;
Authentication-Results: mx.google.com;
       spf=pass (google.com: domain of VivaLoan@mythirdxyz.xyz designates 2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11 as permitted sender) smtp.mailfrom=VivaLoan@mythirdxyz.xyz;
       dkim=pass header.i=@mythirdxyz.xyz;
       dmarc=pass (p=REJECT dis=NONE) header.from=mythirdxyz.xyz
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=mythirdxyz.xyz; 
 i=@mythirdxyz.xyz; q=dns/txt; s=default; t=1453691229; 
 bh=GuM9JCP4yh7WfVbRBortR7UAr6DAtlgy0oTCna0iWQk=; h=MIME-Version : 
 Content-Type : Content-Transfer-Encoding : To : From : Subject : Date : 
 Message-ID : From : Subject : Date; 
 b=e/zS14UB4o5MhYlfbpsy0h2G/oZyoC5H3ouyhNh13zcSHSNXzI6uvJpIy9a+za2ng26Xe2
 NfAI7nenAMCdHJSGF4yfmtTi3+XrR2MqQPHQ1fzTXGhRy/ktCj4tEqt7DhSxnRCqkYFUNaLA
 wh3FMLr6IxPi2Z7xUXm3JBffhDcSU=
MIME-Version: 1.0
Content-Type: text/html; charset="utf-8"
Content-Transfer-Encoding: base64
To: [redacted]@gmail.com
From: "APPROVAL DEPARTMENT" <VivaLoan@mythirdxyz.xyz>
Subject: =?utf-8?q?=F3=BE=93=A0_Personal_loan_as_soon_as_tomorrow_=F3=BE=93=A0?=
Date: Sun, 24 Jan 2016 19:07:09 -0800
Message-ID: <A112ED51-1674-4902-BF73-F2EBCBA42CAF@mythirdxyz.xyz>

3
Цікаво, чи вони goomoji...
jamesmstone

@jamesmstone: Я очікую, що вони є.
але

Відповіді:


9

Коротка відповідь

Замість того, щоб використовувати фільтри Gmail, які залежать від функції пошуку Gmail для пошуку закодованих емоджи у вихідних повідомленнях, створіть скрипт, використовуючи метод GmailMessage :: getRawContent () для обробки повідомлень, використовуючи метод GmailMessage :: getRawContent () .

Пов'язані питання

Далі наводяться посилання на відповіді на подібні запитання на цьому веб-сайті, включаючи сценарії згаданого методу.


2
Варто зазначити, що скрипт не може повністю видалити повідомлення - найбільше це може зробити - перемістити його у папку сміття чи спаму. І якщо такі повідомлення вже переходять у спам, користі від сценарію мало.

@Minestrone: Насправді, можна повністю видалити повідомлення за допомогою сценарію. Він повинен використовувати API Gmail. Див. Розробники.google.com/ gmail/ api/ v1/ reference/ users/ messages/… . Щоб використовувати API Gmail у сценарії Google Apps, перегляньте сторінку developers.google.com/apps-script/guides/services/advanced .
Рубен

1
Мені не так цікаво фактично видаляти повідомлення, як я знаходжу спосіб їх фільтрації. Я, можливо, просто захочу поставити етикетку на них.
але

@AlE. Я припустив це, тому я не згадував про використання GMAIL API в тілі відповіді. З іншого боку, на щастя, я не отримав електронний лист із емоджи на тему.
Рубен

4

Я створив сценарій Google Apps для таких цілей.

Це на Github: https://github.com/spamzero/spamzero

Це дозволяє створювати всілякі вдосконалені правила, які можна зіставити зі своєю папкою спам-повідомлень, тому повідомлення, які безумовно є спамом, будуть очищені автоматично.


1
Ваша відповідь буде кращою, якщо ви додасте короткий опис сценарію, підкреслюючи, як це допоможе обробляти повідомлення з анімованими емоджи у темі.
Рубен

4
Я згоден з @ Rubén, чим більше інформації, тим краще. Оскільки це дозволяє читачам перевірити життєздатність відповідей, не перестрибуючи через занадто багато обручів.
Michelfrancis Bustillos

Дякую за цей сценарій! Іноді найбільш корисними є рішення, які зменшують щоденні роздратування, як анімований спам. Я б запропонував до Github README додати це посилання для швидкого запуску сценарію Google Apps Script, щоб користувачі, які не мають досвіду використання сценаріїв, знали, як увімкнути API Gmail і переглянути журнали.
дан

1

Ви не дуже просите про це (відфільтруйте самі емоджи, а не повідомлення з емоджи), але ви можете знайти якийсь вміст, корисний для створення кращого фільтра повідомлень.

Зараз існує сценарій користувача Greasemonkey / Tampermonkey / Violentmonkey з відкритим кодом, щоб позбутися від цих дратівливих зорових тарганів (лише персонажів, а не самих повідомлень):

Тема Gmail Emoji Roach Motel

Дивлячись на джерело в цьому сценарії , ви побачите , що є два основних типи Emoji тарганів , які ви знайдете в електронних листах від недобросовісних маркетологів ( в даний час , включаючи eBay і Amazon, до жаль):

  • Таргани на основі HTML-зображень (включаючи жахливих мультиплікаційних) aka goomoji

  • Таракани Unicode: Є ще багато емоцій (та інших послідовностей Unicode, що генерують зображення), які спамери та інші маркетологи колись починають використовувати в тематичних рядках електронної пошти, і що Gmail не перетворює на зображення HTML. У деяких браузерах вони відображаються жирними та кольоровими, що майже так само погано, як і анімація. Браузери також можуть вибрати їх для анімації, але я не знаю, чи є. Ці послідовності Unicode відображаються браузером як текст Unicode, тому точний вигляд (кольоровий чи ні, анімований чи ні, ...) залежить від того, яку систему візуалізації тексту використовує браузер. Поява певних смайликів Unicode також залежить від будь-яких селекторів варіацій Unicode та модифікаторів смайликівякі з’являються біля нього в послідовності точок коду Unicode. На відміну від спаму емоджи на основі зображень, ці послідовності можна скопіювати та вставити з браузера та в інші додатки у вигляді тексту Unicode.

Для останнього типу користувальницький сценарій включає регулярний вираз, призначений для фіксації послідовностей Unicode, які, можливо, зловживають маркетологи. Регекс виглядає так у Javascript ES6 (користувальницький сценарій переводить це на широко підтримуваний попередній ES6-регулярний вираз із використанням дивовижного ES6 Regex Transpiler ):

var re = /(\p{Emoji_Modifier_Base}\p{Emoji_Modifier}?|\p{Emoji_Presentation}|\p{Emoji}\uFE0F|[\u{2100}-\u{2BFF}\u{E000}-\u{F8FF}\u{1D000}-\u{1F5FF}\u{1F650}-\u{1FA6F}\u{F0000}-\u{FFFFF}\u{100000}-\u{10FFFF}])\s*/gu

// which includes the Unicode Emoji pattern from
//   https://github.com/tc39/proposal-regexp-unicode-property-escapes
// plus also these blocks frequently used for spammy emojis
// (see https://en.wikipedia.org/wiki/Unicode_block ):
//   U+2100..U+2BFF     Arrows, Dingbats, Box Drawing, ...
//   U+E000..U+F8FF     Private Use Area (gmail generates them for some emoji)
//   U+1D000..U+1F5FF   Musical Symbols, Playing Cards (sigh), Pictographs, ...
//   U+1F650..U+1FA6F   Ornamental Dingbats, Transport and Map symbols, ...
//   U+F0000..U+FFFFF   Supplementary Private Use Area-A
//   U+100000..U+10FFFF Supplementary Private Use Area-B
// plus any space AFTER the discovered emoji spam
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.