| Webテクノロジー | 2006年1月24日 14:00 |
|
IBM、データ検索アーキテクチャ『UIMA』のソースコードを開示 著者: Sean Michael Kerner オリジナル版を読む ▼2006年1月24日 14:00 付の記事 ■海外internet.com発の記事 IBM (NYSE:IBM)が、かねてより進めていたデータ検索アーキテクチャ『Unstructured Information Management Architecture』(UIMA) のオープンソース化計画で新たな動きを見せた。 UIMA はこのほど、人気の高いオープンソース ソフトウェア開発サイト『SourceForge.net』でのダウンロード提供が開始となった。IBM のコンテンツ検索戦略および事業開発担当ディレクタ Marc Andrews 氏によれば、SourceForge.net は UIMA を公開するオープンソース系サイト第1号だが、唯一のサイトになるとは限らないという。 UIMA は、IBM が遅くとも2004年から開発/実用化を行なっているフレームワークで、ドキュメントやその他の多様な非構造化コンテンツソース内にあるテキストを処理し、そこに潜在する意味や関連性を見つけ出す分析アプリケーションや検索ソリューションの構築をサポートする。UIMA は現在、『WebSphere Information Integrator OmniFind Edition』をはじめとする複数の IBM 製品に組み込まれている。 Andrews 氏によると、UIMA はコンテンツソースにまとめてアクセスし、情報共有のための共通構造を提供するタスクの実行を定義するフレームワークで、これを利用すればテキストベースの情報源を分析してその結果を出力できるという。しかし、UIMA 自体にコンテンツを読み込む機能は備わっておらず、分析結果をどのように利用するかも規定していない。 同氏は次のように語っている。「現在のところ、企業がテキスト分析を行なおうとすれば、手作業で分析技術を各ビジネスアプリケーションと連係させるしかない。UIMA の目的は、この連係をプラグ&プレイで簡単に行なえるようにすることだ」 今回の動きの背後にある目的は、UIMA フレームワークの標準化を推し進めることだ。プロジェクトへの広範な参加を促し、新たなオープン標準の確立をめざす動きは、少なくとも1年前から進行していた。米国防総省の国防高等研究計画局 (DARPA) も UIMA を支援しており、2005年の1月には複数の学術、医療、産業組織からなる作業グループを IBM とともに発足させている。 SourceForge.net にプロジェクトサイトを開設したものの、UIMA はまだ完全なオープンなコラボレーション型プロジェクトにはなっていない。現在行なっているのはコード配布のみだ。Andrews 氏によると、コード開発に参加できるようになるまで「2、3か月」の時間が必要という。 |
| トップページ | 画面トップ |
|