迷惑メール除去を自動化!(身近なDX!?)
スパムメールが、ついに1日1000通に
スパムメールが、ついに1日1000通を超えるようになってしまいました。
必要なメールとの振り分けを手でやっていると、それだけで1時間以上かかっていまい、仕事になりません。
メーラのフィルタ機能で振り分け・・・失敗!!
Tunderbirdのフィルタ機能で振分けようとしましたが、なぜかスルーされてしまいます。
スパムメールを分析
スパムメールは、リンク先の表示と実際が異なることが大半なので、人が見分けるのは簡単です。
これをフィルタで設定できるルールに落とし込まないと、自動処理ができません。
スパムメールをよくよく読んで見ると、妙な点に気付きます。
例えば、漢字が普段使っているものと微妙に異なる、句読点があったりなかったりする、等です。
送信主は隣国の人
リンク先がどこか、マウスオーバーしてみると、「・・・.cn」のサーバを使っているので、隣国であることがわかりました。
同じように漢字を使っている国ですが、文字コードは独自のものを使っているので、数字の”一”は、見た目が同じでも文字コードが全く異なる、と言う事象が起こります(別の隣国でも同様)。
つまり、フィルタを設定しても反応しなかったのは、文字コードが日本語用だったからのようです。
文字コード変更で、分離に成功
メールを開いて、差出人名をコピペで設定したところ、無事分離に成功しました。まだ100%とは行きませんが、98%位は分離できるようになりました。スパムメールを除去するストレスから解放され、気分爽快です!
手で仕分けるのと異なり、間違って必要なメールを捨てることも無くなりました。
Ecxelで、送信時間を分析
何かもう少し分析して特徴をつかめないかと、送られてくる時間帯の分布を見てみました。
朝の時間帯に急に増える傾向があるものの、夜中でも間断なくやってくるようなので、どうやら相手は自動化されたシステムのようです。
さすが技術先進国、かつては人海戦術だったのに、今や迷惑メールの送信もDXの時代です。
などと関心している場合ではありませんが、人為的に行われているのに比べて、パターンは限られてそうなので、こうした特徴を見出していけば、新たな”分離不能スパム”が出てきても、対処ができそうです。
今回のような分析は、その都度やれば十分ですが、多くの社員のメールを分析するような場合、ツール化した方が効率的です。
最近は身近なExcelで大量データを処理できるようになった(64bit版)ので、ツール化してみようとお考えでしたら、こちらが多少参考になるかもしれません。