japan.internet.com
japan.internet.com メンバーID
Twitter
Facebook
RSS
ピックアップ
2006年11月28日 15:10

TB 級データを扱い、自然言語処理機能を搭載した XML DB、東芝ソリューションから

システムインテグレーションなどを行う東芝ソリューションは2006年11月28日、 XML DB「TX1 V2」を商品化、販売を開始した。

TX1 V2 では、 自然言語処理機能を搭載して検索性能を向上、 また RDB や Notes などの形式のデータを XML 形式に変換、 登録する機能を新たに搭載した。

XML は、 電子取引などのデータ交換システム以外にも、 ドキュメントや電子メールなどの非定型データを XML 形式で管理する「コンテンツ管理システム」、 システムごとに RDB や Notes などで個別運用されているデータを XML 形式に変換して一元的検索や分析を可能にする「データ統合システム」にまで、 適用範囲が広がっている。

システムを XML DB で構築する場合、 大量データの高速検索、必要なデータを素早く検索する機能、 さまざまな形式のデータを XML データとして扱えること、 などが求められる。

TX1 V2 では、 従来からのテラバイト級データの高速検索機能に加え、 自然言語処理機能や、 さまざまな形式のデータを XML 形式に変換して TX1 に登録するデータ連携機能を搭載した。

搭載した自然言語処理機能は形態素解析方式の検索が可能なもので、 同社の日本語処理技術を基に開発された。 これにより、 Nグラム方式検索に加えて、単語の意味に着目した検索が可能となった。

たとえば、 「東京都港区」というデータは、 Nグラム方式では「東京/京都/都港/港区」という単位で索引化するが、 形態素解析方式では「東京/都/港/区」という単語に意味を持つ単位で索引化する。

データ連携機能では、 元データから XML 形式へのデータ変換方法を指定して実行するだけで、 TX1 に XML データとして登録することができる。

関連テーマ
プリンター用
記事を転送
この記事をクリップ!
【特別連載企画】大艦巨砲主義にして卓越したレスポンス--GALAXY S II WiMAX
【特別連載企画】大艦巨砲主義にして卓越したレスポンス--GALAXY S II WiMAX 1月20日より販売が開始されたサムスン製スマートフォン「GALAXY S II WiMAX」。カタログスペックでは、他メーカーのハイエンド機と同じように見えても、実際に使うと卓越したレスポンスに驚かされる。
⇒詳細記事はこちら
⇒連載記事一覧はこちら
注目のトピックス
最新コラム一覧
百式のネットビジネス研究
百式のネットビジネス研究
次のフライトでお好みの座席が空いたら教えてくれる「Expert Flyer」
週刊-サイト別アクセス状況データ
週刊-サイト別アクセス状況データ
12月の主婦層、ベルメゾンが首位を維持(VRI 調査)
アウンのグローバルマーケティング動向
アウンのグローバルマーケティング動向
Web プロモーションにおいて大切なこと―年度末編―
多言語×Web×海外マーケティング情報
多言語×Web×海外マーケティング情報
海外発、注目 AR プロモーション
エンジニア転職ノウハウ開発室
エンジニア転職ノウハウ開発室
楽天が目指す変革──Globalization、Agile、Big Data
中国・台湾ネットビジネス情報最前線
中国・台湾ネットビジネス情報最前線
中国から Web を見てもらいたいならば
マーケティングに活用できる最新トレンド
マーケティングに活用できる最新トレンド
改めて、「導線」最適化に目を向ける
次世代マーケティングチェーンの視点
次世代マーケティングチェーンの視点
ソーシャル時代における BtoC 型 Eコマース成功のポイント
Copyright 2012 internet.com K.K. (Japan) All Rights Reserved.