Дуже багато спаму проникає через фільтр на поштовому сервері, який я запускаю з порівняно простим трюком, починаючи з декількох рядків (неймовірно очевидного) схуднення або іншого тексту шахрайства вгорі, а потім більшого тексту тексту з документації по програмуванню - або, що найгірше, з усіх текстів, зіскоблених з Stack Exchange . У кращому випадку Спамассасін вважає це BAYES_50, і трапляється, що решта повідомлень побудована досить ретельно, щоб вони не потрапляли на інші тригери. (Наприклад, заголовки мінімальні та правильні.) Часто додані уривки досить чітко узгоджуються з моїми законними інтересами, що загальне повідомлення оцінюється як BAYES_00, тому що самі спам-маркери просто переповнені соковитими нотками вирішення проблем sysadmin.
Верхня частина настільки очевидно спам (і насправді має тенденцію бути дуже схожою на раніше отримані та навчені спам-повідомленнями), що я настільки вражена, що вона переживає - але явно це є. Схоже, окремий пропуск, який набрав перших 25 (або близько того) рядків повідомлення і зважив, що сильно вирішить проблему. Чи є спосіб це зробити?
Кілька людей запропонували написати звичайні регулярні вирази. Я не хочу вникати в це, оскільки це постійна програшна битва. Це те, що робили люди до того, як байєсівське сортування спаму набуло широкого застосування, і це було взагалі жахливо. Жодна людина не може йти в ногу . Це не набагато ефективніше, ніж просто натискання клавіші видалення для кожного спам-повідомлення, і з моєї сторони набагато більше роботи.
Байєсівська фільтрація спаму працює. Він навіть працює на цьому спамі, якщо я розділяю частину " над складкою " і просто проаналізую цю частину, видаляючи приманку / полову. Питання: як я можу змусити Спамассасіна це зробити?