SpamAssassin

SpamAssassin Descrição da imagem Reco spam.png. Em formação
Desenvolvido por Apache Software Foundation
Primeira versão 20 de abril de 2001
Última versão 3.4.4 (25 de janeiro de 2020)
Depósito svn.apache.org/viewvc/spamassassin , svn.apache.org/repos/asf/spamassassin , git: //git.apache.org/spamassassin.git , github.com/apache/spamassassin e svn.apache.org/ repos / asf / spamassassin / trunk
Status do projeto Em desenvolvimento
Escrito em Perl e C
Modelo Anti spam
Licença Licença Apache versão 2.0
Local na rede Internet spamassassin.apache.org

SpamAssassin é um software gratuito desenvolvido pela Apache Software Foundation , autor do popular servidor web Apache HTTP Server . O objetivo deste software é filtrar o tráfego de e-mail para erradicar e-mails reconhecidos como spam ou e-mails não solicitados.

Diante do aumento significativo de spam , este software está experimentando uma popularidade significativa e é adaptável a muitos servidores de e-mail, incluindo procmail , sendmail , Postfix , Exim , qmail  ; ele pode ser instalado na maioria dos GNU / Linux , o Windows e sistemas baseados em Mac OS X .

O SpamAssassin é distribuído gratuitamente sob a Licença de Software Apache , mas é possível contribuir financeiramente para incentivar seu desenvolvimento.

Operação

SpamAssassin é um programa (em Perl ) que executa vários testes na mensagem. Com base no resultado desses testes, ele atribui uma pontuação à mensagem.

Se a pontuação ultrapassar um determinado limite, o e - mail será considerado Spam. O SpamAssassin então modifica o título da mensagem (emoldura com ***** SPAM *****). Além disso, SpamAssassin define dois novos cabeçalhos de mensagem: X-Spam-Status e X-Spam-Level.

Esses dois cabeçalhos permitem que você crie filtros em seu cliente de e-mail para direcionar a mensagem (por exemplo, para a lixeira ).

Todas as mensagens devem, portanto, passar pelo SpamAssassin para serem processadas, antes de chegarem à pasta final.

Aqui está um exemplo de cabeçalhos adicionados a uma mensagem filtrada por SpamAssassin:

X-Spam-Level: ********* X-Spam-Status: Yes, score=9.0 required=5.0 tests=BAYES_99,FROM_EXCESS_BASE64, FR_HOWTOUNSUBSCRIBE,FR_SPAMISLEGAL,FR_SPAMISLEGAL_2,HK_RANDOM_ENVFROM, HTML_IMAGE_RATIO_04,HTML_MESSAGE,UNPARSEABLE_RELAY autolearn=no version=3.3.1 X-Spam-Report: * 3.5 BAYES_99 BODY: Bayes spam probability is 99 to 100% * [score: 1.0000] * 0.0 HK_RANDOM_ENVFROM Envelope sender username looks random * 1.0 FR_SPAMISLEGAL_2 BODY: French: droit d acces de modification de * rectification * 2.0 FR_HOWTOUNSUBSCRIBE BODY: French: how to unsubscribe * 1.0 FR_SPAMISLEGAL BODY: French: Conformement ou En vertu....la loi * 0.6 HTML_IMAGE_RATIO_04 BODY: HTML has a low ratio of text to image area * 0.0 HTML_MESSAGE BODY: HTML included in message * 1.0 FROM_EXCESS_BASE64 From: base64 encoded unnecessarily * 0.0 UNPARSEABLE_RELAY Informational: message has unparseable relay lines

Notamos que há 9 estrelas no cabeçalho X-Spam-Level que correspondem bem a uma pontuação geral de 9,0 (> = 9 e <10) exibida como o segundo argumento do cabeçalho X-Spam-Status. Segue nesta mesma linha, o limite exigido, por defeito de 5,0, definido para qualificar esta mensagem como Spam (Sim), bem como a lista dos vários testes que contribuíram para modificar esta pontuação global. O cabeçalho X-Spam_Report fornece a quantificação das diferentes pontuações, bem como uma mensagem explicativa.

Notamos neste exemplo que a pontuação mais importante, 3,5, é relatada pelo teste de Bayes. É de fato aprendendo pelo menos 200 mensagens qualificadas manualmente por você como spam e 200 mensagens qualificadas como não spam (ham) que esta probabilidade será calculada e será atribuída uma pontuação, aqui de 3,5, mas que pode ser negativa dependendo nas palavras utilizadas no corpo da mensagem recebida. Essa base de conhecimento terá que evoluir com o tempo porque os spammers também reagem a essas regras e você ou a organização que gerencia seu e-mail terá que melhorá-la, enviando spam que não foi detectado, assim como aqueles que foram falsamente detectados para um aprendizado programa chamado sa-learn, que reside no seu servidor de email e não no seu cliente de email. Em outras palavras, não será tão fácil para você melhorar sua eficiência se você não tiver acesso a este servidor e, na maioria das vezes, será reduzido a classificar spam usando as opções de filtragem de seu cliente de e-mail.

Na prática, muitas vezes é proposto classificar suas mensagens em duas classes, uma primeira onde são agrupadas as mensagens cuja pontuação é por exemplo superior a 12 que irão diretamente para o lixo e uma segunda (cuja pontuação irá de 5 a 12) do qual você precisará extrair falsos negativos.

Na França, a legislação autoriza o spam sob certas condições de registro de avisos legais, como a possibilidade de cancelar a assinatura de uma "campanha" publicitária. No entanto, você também tem o direito de colocar esses folhetos no lixo e classificá-los automaticamente. Assim, ao adicionar regras ao arquivo de filtragem de inglês do Spamassassin que detecta a frase legal "Em conformidade" ou "Em virtude" de "la loi" e outras regras específicas do francês francês e dando-lhes as pontuações adequadas, você obterá uma filtragem muito mais apropriada do que pode ser visto neste exemplo.

A filtragem mais eficaz, no entanto, continuará sendo a filtragem Bayesiana porque é específica para o perfil do seu destinatário, que é, em parte, construída por spammers de suas andanças na Web e endereços de e-mail que foram vendidos ou roubados sem o seu conhecimento.

Notas e referências

  1. CRÉDITOS do SpamAssassin
  2. "  https://projects.apache.org/json/projects/spamassassin.json  " (acessado em 8 de abril de 2020 )
  3. "  https://github.com/apache/spamassassin/releases/tag/spamassassin_release_3_4_4  " ,25 de janeiro de 2020
  4. "  Regras do SpamAssassin contra spam em francês" da França "  " (acessado em 7 de junho de 2013 )

Veja também

Artigos relacionados

links externos