|
事業仕分けによる次世代スーパーコンピューターの開発予算削減について、どうお考えですか?
|
三菱電機、言葉の関連性を学習する概念抽出型文書知識サーバーを開発三菱電機株式会社は2003年2月13日、加工されていない雑多な文書から概念を抽出し、潜在する新知識を発掘して提供する概念抽出型文書知識サーバーを開発した、と発表した。
概念抽出型文書知識サーバーは、自動的に概念を抽出する「概念抽出型テキストマイニング」、手書き文書、図面、電子文書などの様々の文書からキーワード検索を可能とする「レンディションフリー文書解析技術」、ディスク装置から効率良く並列にデータを読み出しながら検索処理を行なう「並列ナレッジ検索プラットフォーム」の3つの技術を装備している。 概念の抽出技術として、文書中で近くに出現する単語や複合語の傾向から、文書群に応じた概念を自動的に学習する複合概念抽出方式を開発した。従来の類義語辞書を作成するやり方とは異なり、単語や複合語の類似度を計算することで、表現が異なる類似文書からでも関連した言葉を抽出することができる。 たとえば、モバイル機器を題材にした文書では、「ピッチ」の関連語として「PHS」や「ケータイ」、「低料金」などを抽出することが可能となる。 同サーバーは、一般企業・官公自治体等における研究、企画などの各種業務のほか、EIP、文書知識提供サービスや保守サービスなどへの展開が可能。グループウェアやセキュリティなどのシステムと連携させ、さまざまな用途への展開を図る。 関連記事 最新トップニュース
|
japan.internet.com 10周年記念
インターネットコムマーケティングセミナー ROI を最適化するパフォーマンスマーケティングの最前線 【12/16(水)13時〜 東京・赤坂】 申込はコチラ>>
|