最近あまりにもSPAMが多いので、spamassassinなるものを導入してみた。
ちなみに1日あたりのSPAMの数は
自分のアドレス宛:数件
とあるサーバの管理用(adminやwebmaster)のアドレス宛:十数件件
とあるメールサーバのdoublebounceメール(postmaster宛):数十件
くらいだろうか。
とりあえず自宅サーバにためしに入れてみたけど、自宅サーバのメールアドレスに
メールなんて来ないから良くわからず・・・
ってことでメインのメールを受け取るサーバにも即導入
1日目
とりあえずはじいているって感じ
誤検出がちらほらあり
1.SPAMじゃないのをSPAM扱い数件
2.SPAMなのにSPAMじゃない扱い数件
3.dublebunceメールの中身がSPAMなのに対して
SPAM扱い数件
SPAMじゃない扱い9割くらい
(というかこれはほとんど検出してくれなかった)
うーん、3を検出してくれるとかなりうれしいかも
2日目
とりあえず誤検出をへらしたかったのでベイジアンフィルター?っていうのかな
それを利用するためにSPAMメール800通とSPAMじゃないメール1200通をサーバに
それぞれSCPしてそれをspamassassinに学習させてみた
sa-learn --spam --dir spam #spamメールの学習
sa-learn --ham nonspam/* #spamじゃないメールの学習
その結果
1.SPAMじゃないのをSPAM扱い数件
2.SPAMなのにSPAMじゃない扱い数件
3.dublebunceメールの中身がSPAMなのに対して
SPAM扱い9割くらい?
SPAMじゃない扱い数件
1だけど、とあるMLに投稿してくる人のメールサーバがSPAMCOPやら
あちこちのDBに登録されているらしくて、どんなに学習させてもSPAM扱いにしてしまう ^^;
とりあえずこれは設定で逃げれそうだがしばらくは様子みたいので放置
2は日本語のSPAMだったので、その後即学習
3がかなりよくなった。
ほとんど検出してくれるようになった。すごい効果である。
これで、管理しているメールサーバのdoublebounceメールから
SPAMのdublebounceじゃないメールを探し出すのに一苦労だったのが
かなり楽になりそう。
これはかなりいいかも
もっと早くに使えばよかった。
ちなみに、学習だけど、最初に数件登録してみたけど機能してくれませんでした。
マニュアルをみるとある程度データがそろわないと機能しないそうです。