Segunda-feira, 20 de Agosto de 2007
Servidor caseiro - XXII
O FuzzyOCR é um
plugin para o SpamAssassin que se destina a apanhar SPAM por palavras contidas em imagens nas mensagens de correio electrónico, algo que se está a tornar moda no
basfond dos spammers.
O FuzzyOCR necessita primeiro que seja instalado algum software antes dele próprio:
Dois módulos PERL:
String::ApproxTime::HiRes# perl Makefile.PL && make && make installA giflib:
# ./configure && make && make install && ldconfigA libungif:
./configure && make && make install && ldconfigO ocrad:
./configure && make && make installA netpbm:
# ./configure# make # make package pkgdir=/usr/local/lib/netpbm# ./installnetpbmO gocr com suporte a netpbm:
# ./configure --prefix=/usr/local --with-netpbm=../netpbm-10.26.42# make# make installO gifsicle:
# ./configure# make# make installO FuzzyOCR:
# cp -p -r FuzzyOcr* /etc/mail/spamassassin/Em /etc/mail/spamassassin, está agora um ficheiro chamado FuzzyOcr.words que contém a lista de palavras que ele procura nas imagens.
Podemos acrescentar a gosto quantas quisermos.
Convém acrescentar o PATH dos binários do netpbm ao PATH do sistema:
# export PATH=$PATH::/usr/local/netpbm/bin/Vou agora enviar um e-mail da minha conta do GMail, sem qualquer texto, apenas com a seguinte imagem:
e verificar qual o resultado.
Chegada a mensagem, vou ver o envelope para verificar o resultado:
From - Mon Aug 20 22:37:21 2007X-Account-Key: account6X-UIDL: 1187645780.11464.planetgeek.dynip.sapo.pt,S=28372X-Mozilla-Status: 0001X-Mozilla-Status2: 10000000X-Mozilla-Keys: Return-Path: <gamito@gmail.com>Delivered-To: teste@planetgeek.dynip.sapo.ptReceived: (qmail 11461 invoked by uid 513); 20 Aug 2007 21:36:20 -0000Received: from 209.85.128.185 by planetgeek.dynip.sapo.pt (envelope-from <gamito@gmail.com>, uid 0) with qmail-scanner-2.01 (f-prot: 4.6.7/3.16.15. spamassassin: 3.2.3. Clear:RC:0(209.85.128.185):SA:1(8.0/5.0):. Processed in 14.989563 secs); 20 Aug 2007 21:36:20 -0000X-Spam-Status: Yes, score=8.0 required=5.0X-Spam-Level: ++++++++(...)Received: by 10.82.108.9 with SMTP id g9mr5049417buc.1187645797008; Mon, 20 Aug 2007 14:36:37 -0700 (PDT)Received: by 10.82.100.10 with HTTP; Mon, 20 Aug 2007 14:36:36 -0700 (PDT)Message-ID: <91df29a20708201436lb3458a6j3c4fe5c266baed3d@mail.gmail.com>Date: Mon, 20 Aug 2007 22:36:36 +0100From: "=?ISO-8859-1?Q?M=E1rio_Gamito?=" <gamito@gmail.com>To: teste@planetgeek.dynip.sapo.ptSubject: [+++ SPAM +++] Teste FuzzyOCRMIME-Version: 1.0Content-Type: multipart/mixed; (...)Conforme se pode verificar, a mensagem apenas com a imagem foi classificada com um score de 8.0, logo é SPAM.
E pode ver-se no Thunderbird:
Cool, isnt't it ?
Os comentários são da exclusiva resonsabilidade dos seus autores.
Mário Gamito, 2004 - 2007
Todos os direitos reservados.