Webテクノロジー2006年11月28日 15:10
文字サイズ文字サイズ小文字サイズ中文字サイズ大

TB 級データを扱い、自然言語処理機能を搭載した XML DB、東芝ソリューションから

この記事のURLhttp://japan.internet.com/webtech/20061128/1.html
著者:japan.internet.com 編集部
国内internet.com発の記事
システムインテグレーションなどを行う東芝ソリューションは2006年11月28日、 XML DB「TX1 V2」を商品化、販売を開始した。

TX1 V2 では、 自然言語処理機能を搭載して検索性能を向上、 また RDB や Notes などの形式のデータを XML 形式に変換、 登録する機能を新たに搭載した。

XML は、 電子取引などのデータ交換システム以外にも、 ドキュメントや電子メールなどの非定型データを XML 形式で管理する「コンテンツ管理システム」、 システムごとに RDB や Notes などで個別運用されているデータを XML 形式に変換して一元的検索や分析を可能にする「データ統合システム」にまで、 適用範囲が広がっている。

システムを XML DB で構築する場合、 大量データの高速検索、必要なデータを素早く検索する機能、 さまざまな形式のデータを XML データとして扱えること、 などが求められる。

TX1 V2 では、 従来からのテラバイト級データの高速検索機能に加え、 自然言語処理機能や、 さまざまな形式のデータを XML 形式に変換して TX1 に登録するデータ連携機能を搭載した。

搭載した自然言語処理機能は形態素解析方式の検索が可能なもので、 同社の日本語処理技術を基に開発された。 これにより、 Nグラム方式検索に加えて、単語の意味に着目した検索が可能となった。

たとえば、 「東京都港区」というデータは、 Nグラム方式では「東京/京都/都港/港区」という単位で索引化するが、 形態素解析方式では「東京/都/港/区」という単語に意味を持つ単位で索引化する。

データ連携機能では、 元データから XML 形式へのデータ変換方法を指定して実行するだけで、 TX1 に XML データとして登録することができる。

Copyright 2008 Jupitermedia Corporation All Rights Reserved.http://www.internet.com/