反撃するフィルター
Original2003年8月
ベイジアンスパムフィルターの精度を向上させるために、リンクをたどってその先にあるものを確認することができるかもしれません。death2spamのRichard Jowseyは、境界線上のケースでこれを行っており、うまくいっていると報告しています。
なぜ境界線上のケースでのみ行うのでしょうか? そして、なぜ1回だけなのでしょうか?
Will Filters Kill Spam?で述べたように、スパムに含まれるすべてのURLをたどることには面白い副作用があります。人気のメールクライアントがこれを行ってスパムをフィルタリングすれば、スパマーのサーバーは深刻な打撃を受けることでしょう。これについて考えれば考えるほど、より良いアイデアだと思えてきます。これは単に面白いだけではなく、スパマーに対する最も的確な反撃策だと考えられます。
そのため、スパムフィルターに追加機能として「処罰」モードを設けることを提案したいと思います。これにより、ユーザーが設定した回数だけ、疑わしいスパムのすべてのURLをクロールすることができます。[1]
多くの人が指摘しているように、現在のメールシステムの問題の1つは受動的すぎることです。指示されたことしかしません。これまでの修正案はすべて新しいプロトコルを必要としていますが、この提案は必要ありません。
広く使われれば、自動取得型のスパムフィルターによってメールシステムは「反撃」することになります。これまでスパマーに有利に働いてきた膨大なスパムの量が、今度は逆に彼らに不利に働くのです。自動取得型のスパムフィルターによって、スパマーのコストは高騰し、売上は下がるでしょう。帯域幅の使用量が急増し、サーバーは過負荷で動作不能に陥るため、スパムの送信先にも到達できなくなるのです。
1時間に100万通のメールを送信すれば、1時間に100万件のアクセスを受けることになります。
疑わしいスパムにのみ行うようにする必要があります。大量のメールに送られているURLはほとんどがスパムのURLだと考えられるので、すべてのメールのすべてのHTTPリクエストを送信すれば、ほとんどの場合うまくいくでしょう。しかし、Yahoo MailやHotmailなどの無料メールサービスから送信されたメールの末尾のURLなど、例外もあります。
このような サイトを保護し、悪用を防ぐために、自動取得は スパム送信サイトのブラックリストと組み合わせる必要があります。ブラックリストに載っているサイトのみがクロールされ、サイトはヒトによる検査の後にのみブラックリストに登録されます。スパムの寿命は最低でも数時間はあるので、新しいサイトを宣伝するスパムが出現する前に、リストを更新することは簡単でしょう。[2]
大量の自動取得は、高帯域幅接続のユーザーにしか実用的ではありませんが、そのようなユーザーは十分にいて、スパマーに深刻な問題を引き起こすことができます。この解決策は問題そのものを反映しています。スパムの問題は、わずかな愚かな人々に到達するために、誰もが受け取らされるというものです。しかし、愚かでない大多数がスパムを受け取るのを止めるには、愚かな人々がそれに反応するのを止めさせるか、脅かす必要があります。自動取得型のスパムフィルターはそのための手段を提供します。
これでスパムは完全に消滅するでしょうか? 完全ではありません。最大手のスパマーはおそらく自動取得型フィルターに対抗できるでしょう。しかし、彼らにとって最も簡単で安価な方法は、メールに有効な購読解除リンクを含めることです。小規模事業者や「正規の」サイトがスパマーを雇って宣伝する場合にも、これは必須となるでしょう。したがって、自動取得型フィルターが広く使われるようになれば、自動購読解除フィルターになるのです。
このシナリオでは、スパムは、OSクラッシュ、ウイルス、ポップアップなどと同じように、適切なソフトウェアを使わない人にしか影響しない災害となるでしょう。
注記
[1] 自動取得型フィルターはリダイレクトに従う必要があり、場合によっては(「ここをクリックしてください」と書かれているページなど)複数のリンクレベルをたどる必要があります。また、人気のWebブラウザと同じようなHTTPリクエストを行い、リファラーも正しくする必要があります。
レスポンスが一定時間内に返ってこない場合は、かなり高いスパム確率を設定するのがよいでしょう。
nを一定値にするのではなく、これまでに見つかったスパムでそのサイトが言及された回数の関数とするのも良いかもしれません。これにより、悪用や事故に対するさらなる保護が得られます。
[2] この記事の初版では「ホワイトリスト」という用語を使っていましたが、ブラックリストのように機能するにもかかわらず、法的攻撃を受けにくくするためでした。しかし、これは読者を混乱させただけのようです。
複数のブラックリストを設けるのが賢明でしょう。単一の障害点は、攻撃や悪用に対して脆弱です。
謝辞 Brian Burton、Bill Yerazunis、Dan Giffin、Eric Raymond、Richard Jowseyの各氏には、この原稿の草稿を読んでいただきました。