japan.internet.com
デベロッパー2005年10月5日 13:50
文字サイズ文字サイズ小文字サイズ中文字サイズ大

.NET とAIでスパムボットに対抗する(5)

この記事のURLhttp://japan.internet.com/developer/20051005/33.html
著者:Adnan Masood
海外internet.com発の記事
 前回「CAPTCHA を Web サービスから配布または呼び出す方法」へ

まとめ

 CAPTCHA は「Completely Automated Public Turing Test to Tell Computers and Humans Apart(コンピュータと人間を区別する完全に自動化された公開チューリングテスト)」の略であり、人間のふりをする自動ボットやインテリジェントエージェントからデジタル資産を守るためのテストである。この戦いは今後も続いていくだろう。CAPTCHAを破るためには、洗練されたアプリケーションとよりただし、高度なOCR機能による、機械の「視覚」が新たな進化を遂げる必要がある。

 CAPTCHAは、障害者や弱視の人には敷居の高いテストである。したがって、W3Cのアクセシビリティガイドラインに従う必要がある。

 本稿は、スパムを排除するための科学的ソリューションに焦点を当てた記事シリーズの第1弾である。本シリーズの第2弾では、C#.NETでベイズ式テキスト分類APIライブラリを開発する方法について取り上げる。シリーズ最後となる第3弾では、そのベイズ式テキスト分類ライブラリを使用して、Webサービスを使ったスパムフィルタを実装してみる。読者の皆さんもぜひ実際に試していただきたい。

デモ

 このページからデモを体験できる。

参考資料

  1. CAPTCHAホームページ
  2. Breaking a visual CAPTCHA Greg Mori and Jitendra Malik, UC Berkeley Computer Vision Group
  3. Telling Humans & Computers apart (to appear in CACM)
  4. CAPTCHA:Using Hard AI Problems for Security (Eurocrypt)
  5. Protect Your Online Forms By John Clyman
  6. CAPTCHA-ing the Spammer By Cade Metz

ニュース

  1. Human or Computer? Take This Test, The New York Times, December 10, 2002.
  2. Up to the Challenge: Computer Scientists Crack a Set of AI-Based Puzzles, SIAM News, November 2002.
  3. Robot solves Internet robot problem By Byron Spice, Pittsburgh Post-Gazette, October 21, 2001
  4. Computer or Human? New Programs can tell By Matt O’Brien, University of Miami Newspaper, November 20, 2001
  5. Can Hard AI Problems Foil Internet Interlopers? By Sara Robinson, SIAM News, April 2002
  6. Researchers battle e-mail stealing Web bots with identity checks By Mike Crissey, The Associated Press, December, 2002
  7. Computer Pioneer Aids Spam Fight, The BBC News, January, 2003
  8. Recognizing Objects in Adversarial Clutter: Breaking a Visual CAPTCHA (2003) Greg Mori, Jitendra Malik

チューリングテスト

  1. A. M. Turing (1950) Computing Machinery and Intelligence. Mind 49: 433-460.
  2. The Turing test page
  3. Alan Turing Homepage
  4. AI Glossary - Syracuse University
  5. Technical Solutions for Controlling Spam
  6. BaffleText:a Human Interactive Proof
  7. Gimpy High Level Description
  8. Gimpy Paper
  9. Telling Humans and Computers apart OR How Lazy Cryptographers do AI
    Luis von Ahn_ Manuel Blum_ John Langford_

関連団体

  1. Computer Science Dept., Carnegie Mellon University, Pittsburgh
  2. The UC Berkeley Computer Vision Group
  3. Shape Matching and Object Recognition
  4. Detecting Natural Image Boundaries
  5. British Computing Society Artificial Intelligence Group

その他

  1. Yahoo!でのEZGimpyの使用例
  2. Practical A.I. - Introduction - Ben Garcia
  3. Web Methods returning something else than XML?
  4. Sapience Validation(XML RPCベースのサービス)
    Sapienceの中核は、Paul Tremblettが『Dr Dobb’s Journal』2003年10月号で発表した画像ジェネレータである。Dav ColemanがこれをXML RPCサービスに変換し、Sapienceシステムを開発した。
  5. View the Real World in Your Application, with TerraServer, by Karl Moore
  6. CityView App: Build Web Service Clients Quickly and Easily with C#, MSDN Magazine
  7. Demonstration of using Base64 encoding, in a Web Service using the .NET Framework, by Robert Chartier
  8. Baffling the Bots, by Lee Bruno

ボット関連のWebサイト

  1. http://www.runabot.com/
  2. http://www.activebuddy.com/
  3. http://members.aol.com/adamkb/aol/imbots
  4. http://www.pandorabots.com/pandora
  5. Botspot
  6. How to build a Bot Trap and keep bad bots away from a web site
  7. Robot Exclusion
  8. Computer Vision and Image Understanding: Palo Alto Research Center
  9. Stopping Spambots:A Spambot Trap
    Using Linux, Apache, mod_perl, Perl, MySQL, ipchains and Embperl, By Neil Gunton
  10. SECURITY and CRYPTOGRAPHY 15-827 Lecture #17
  11. OGDEN’s BASIC ENGLISH
  12. Base64 content-Transfer-encoding
  13. CAPTCHAについて初めて言及した論文:
    L. Coates, H. S. Baird, R. Fateman, "Pessimal Print:a Reverse Turing Test," Proc., 6th IAPR Int’l
  14. Conf.On Document Analysis & Recognition, Seattle, WA, Sept. 10-13, 2001.
    Hosted first professional event:1st NSF Int’l Workshop on HIPs, Jan. 9-11, 2002, Palo Alto, CA.
  15. ImageMagik: Image Manipulation API
  16. Securing passwords against dictionary attacks
 「はじめに」へ戻る

著者紹介

Adnan Masood(Adnan Masood)
ロンドンのUKIMのソフトウェア開発者。UNW Stratford Londonキャンパスにてソフトウェア工学の理学修士号を取得。複数のソフトウェア開発技術にまたがるハイブリッド的な視野を持って開発に臨み、主にMicrosoftおよびSunプラットフォームのサーバーサイドプログラミングを専門とする。ここ5年間はASPおよびJavaの開発者として活躍。コンピュータ工学の理学士号とSun Java-II Certification(SCJP-II)の資格を持つ。ブログのURLはwww.axisebusiness.com/adnano。電子メールアドレスはamasood@bcs.org.uk
japan.internet.comのウエブサイトの内容は全て、国際法、日本国内法の定める著作権法並びに商標法の規定によって保護されており、その知的財産権、著作権、商標の所有者はインターネットコム株式会社、インターネットコム株式会社の関連会社または第三者にあたる権利者となっています。
本サイトの全てのコンテンツ、テキスト、グラフィック、写真、表、グラフ、音声、動画などに関して、その一部または全部を、japan.internet.comの許諾なしに、変更、複製、再出版、アップロード、掲示、転送、配布、さらには、社内LAN、メーリングリストなどにおいて共有することはできません。
ただし、コンテンツの著作権又は所有権情報を変更あるいは削除せず、利用者自身の個人的かつ非商業的な利用目的に限ってのみ、本サイトのコンテンツをプリント、ダウンロードすることは認められています。

Copyright 2012 internet.com K.K. (Japan) All Rights Reserved.