![]() ![]() ![]() ![]() 三菱電機、言葉の関連性を学習する概念抽出型文書知識サーバーを開発この記事のURLhttp://japan.internet.com/webtech/20030217/2.html
著者:japan.internet.com 編集部
国内internet.com発の記事
三菱電機株式会社は2003年2月13日、加工されていない雑多な文書から概念を抽出し、潜在する新知識を発掘して提供する概念抽出型文書知識サーバーを開発した、と発表した。
概念抽出型文書知識サーバーは、自動的に概念を抽出する「概念抽出型テキストマイニング」、手書き文書、図面、電子文書などの様々の文書からキーワード検索を可能とする「レンディションフリー文書解析技術」、ディスク装置から効率良く並列にデータを読み出しながら検索処理を行なう「並列ナレッジ検索プラットフォーム」の3つの技術を装備している。 概念の抽出技術として、文書中で近くに出現する単語や複合語の傾向から、文書群に応じた概念を自動的に学習する複合概念抽出方式を開発した。従来の類義語辞書を作成するやり方とは異なり、単語や複合語の類似度を計算することで、表現が異なる類似文書からでも関連した言葉を抽出することができる。 たとえば、モバイル機器を題材にした文書では、「ピッチ」の関連語として「PHS」や「ケータイ」、「低料金」などを抽出することが可能となる。 同サーバーは、一般企業・官公自治体等における研究、企画などの各種業務のほか、EIP、文書知識提供サービスや保守サービスなどへの展開が可能。グループウェアやセキュリティなどのシステムと連携させ、さまざまな用途への展開を図る。
japan.internet.comのウエブサイトの内容は全て、国際法、日本国内法の定める著作権法並びに商標法の規定によって保護されており、その知的財産権、著作権、商標の所有者はインターネットコム株式会社、インターネットコム株式会社の関連会社または第三者にあたる権利者となっています。
本サイトの全てのコンテンツ、テキスト、グラフィック、写真、表、グラフ、音声、動画などに関して、その一部または全部を、japan.internet.comの許諾なしに、変更、複製、再出版、アップロード、掲示、転送、配布、さらには、社内LAN、メーリングリストなどにおいて共有することはできません。 ただし、コンテンツの著作権又は所有権情報を変更あるいは削除せず、利用者自身の個人的かつ非商業的な利用目的に限ってのみ、本サイトのコンテンツをプリント、ダウンロードすることは認められています。 |