[目次]  [1ページ目]  [前ページ]  [次ページ]  [質疑応答]
2004年度システム技術分科会 第1回会合
Spamメール解析とSpam対策

(5/9)
  • Spamはどこから来るか?

    ヘッダから抜き出したSpam発信元のIPアドレスを元に逆引きを試みた.表1に,Spam発信に利用されたドメインの名前と当該ドメインからのSpamメール送付件数を示す.ただし,Spamメール発信数の少ないドメインについては,まとめて示している.

    表1 IPアドレスから見たSpam送信ドメイン
    ドメイン送付件数比率(%)
    shawcable.net2211.13
    swbell.net2621.34
    charter.com2821.44
    dsl-verizon.net2841.45
    adelphia.net2931.50
    ameritech.net3201.63
    pacbell.net3621.85
    optonline.net3901.99
    attbi.com7113.63
    発信1回7313.73
    rr.com8224.20
    発信10回以下13606.95
    発信200回以下14327.31
    発信100回以下380619.44
    comcast.net218111.14
    未設定612531.28
    合計19582100.00


    Spam送付に使われたホストのうちで,DNSの逆引きが設定されていないものが約32%存在する.これに対して,200通以上(割合にして1%以上)Spamメールを発信したドメインは非常に限定されていることが見て取れる.表では,ISP単位にまとめているために読み取れないが,DNSの逆引き結果をみると,大量のSpamメールはISPがDHCPにより動的に割り当てていると推定される名前のホストから発信されるケースが大半をしめている.

    HELOコマンドで与えられる情報と実際に接続してきたホストのドメイン名との一致度を調べると,結果は図4のようになる.図3および図4から,逆引きが設定されていないものおよび逆引きとHELOパラメータ値の不一致の排除に,大量のSpamを送付してくるISPのアドレスの排除を組み合わせると約6割のSpamメールが排除できそうである.ただし,DNSで引けるかどうかだけの検査だけでは,大規模ISPのブロードバンド端末からのSpam発信は,排除できないこともわかる.

    以上は,IPアドレスから見たケースであるが,メールヘッダのFromから見た場合の差出人の所属ドメインの分類は表2のようになる.もちろん,SpamメールのFromの値は詐称されているのが普通なので,これは詐称に利用されやすいドメインのリストでもある.なお,1回だけSpam発信元に使われるアドレスが5000近くあるので,データベースを利用して,初見のFromからの接続を一旦サーバエラーとして拒否する方式も考えられる.いわゆる「一見さんお断り」方式[5] も,30分程度の配送遅延を許容するならば一定の効果が見込まれる.

    しかしながら,値やパターンでフィルタするという観点からは,IPアドレスもしくはISPのドメイン名でフィルタするのに対して,ヘッダのFromの値によるパターンマッチフィルタは,効率が悪いといえる.
    表2 よく使われるFrom値
    FromのドメインSpam件数割合(%)
    yahoo.com.hk1010.50
    yahoo.ca1090.53
    juno.com1220.60
    earthlink.net1360.67
    email.com1480.73
    LYCOS.COM1560.77
    excite.com1840.90
    mail.com1900.93
    attbi.com2391.17
    aol.com5012.46
    MSN.COM7513.68
    HOTMAIL.COM9944.88
    yahoo.com16658.17
    100回未満454722.30
    1回きり472723.18
    10回未満581928.54
    合計20389100.00

  • [目次]  [1ページ目]  [前ページ]  [次ページ]  [質疑応答]

    All Rights Reserved, Copyright©サイエンティフィック・システム研究会 2004