japan.internet.comThe Internet & IT Network
Twitter
RSS
  • ニュース
  • コラム
  • リサーチ
  • ヘッドライン
  • 特集
  • ブログ
  • プレスリリース
  • 専門チャンネル
  • イベント
  • ランキング
  • ニュースメール
2009年11月22日
文字サイズ文字サイズ小文字サイズ中文字サイズ大
今年も各携帯キャリアが冬モデルを発表!買う予定はありますか?
今年中に買う予定
来年には買う予定
しばらく買う予定はない
現在の携帯が壊れるまで買わない
投票締切 11/23 12:00
Webテクノロジー2005年7月21日 17:00

沖電気、NICT と Web ページからの新語獲得技術を開発

国内国内internet.com発の記事
  • Post to Twitter
  • Post to Facebook
  • このエントリーを含むはてなブックマーク
  • この記事をクリップ!
  • Buzzurlにブックマーク
  • Yahoo!ブックマークに登録
  • newsing it!
  • この記事をokyuuへインポート
独立行政法人情報通信研究機構(NICT)と沖電気工業株式会社は2005年7月21日、 Web ページから新語を獲得して属性を判別する技術を共同開発した、 と発表した。

今回開発された技術は、 大量の Web ページに対して、 文を文法的に意味のある最小の単位、 形態素に分割して品詞情報を付与する形態素解析を行い、 文中の形態素列の頻度と、 その前後の形態素の異なり数とを指標とした関数を用いて用語を獲得するもの。

名詞のみで構成される用語だけでなく、 助詞などを含む用語も獲得できる。 さらに固有表現抽出や既存辞書とのマッチングを行って用語を構成する形態素に素性を割り当て、 その情報を利用して用語全体の属性を判別する。

形態素に素性を割り当てられない場合にも、 その形態素の用語全体に対する影響を考慮して属性を推定できる。

さらに、実システムへの導入を考慮して処理を高速化、 テキストで 200MB の収集済み Web ページ(約1億文字、2年分の新聞記事に相当)を、 平均1日で処理、用語を獲得する。

これにより、 従来は追加が困難だった最新用語を、 高速で Web ページから獲得・判別できるようになる。

この技術は、 NICT けいはんな情報通信オープンラボにおける、 沖電気と NICT の共同研究の成果。

  • プリンター用
  • 記事を転送
  • Post to Twitter
  • Post to Facebook
  • このエントリーを含むはてなブックマーク
  • この記事をクリップ!
  • BuzzurlにブックマークBuzzurlにブックマーク
  • Yahoo!ブックマークに登録
  • newsing it!
  • この記事をokyuuへインポート
最新トップニュース
Graphic Design Forum
【Graphic Design Forum】
流動的媒体と静的媒体に関する見解(11月18日)
「IT の耳」
「IT の耳」
【書評】『Hyper-V スタートアップバイブル』――仮想化についてのすぐれた解説書(11月20日)
百式のネットビジネス研究
百式のネットビジネス研究
世界でもっともパワフルな iPod のスピーカー「Wall of Sound」(11月20日)
週刊-サイト別アクセス状況データ
週刊-サイト別アクセス状況データ
ビデオリサーチインタラクティブ調査(月間インターネットオーディエンスデータ)(11月19日)
海外ソーシャルウェブに学ぶ成功の秘訣
海外ソーシャルウェブに学ぶ成功の秘訣
ゲーム業界を襲う世界的な激震。ソーシャルゲーム急成長のインパクト(11月19日)
今さら聞けない初歩からのアクセス解析
今さら聞けない初歩からのアクセス解析
サイトリニューアル前のアクセス解析活用法(11月19日)
成約率、反応率を上げる Web 文章術
成約率、反応率を上げる Web 文章術
文章力を磨き、キャッシュを生み出す Web サイト に(11月19日)
「Webからの脅威」―その傾向と最新対策
「Webからの脅威」―その傾向と最新対策
新たな対策技術:スパムフィルタリングと E-mail レピュテーション(11月18日)
ROI向上のための戦略的WebPR
ROI向上のための戦略的WebPR
「戦略的 WebPR」のしかけ方〜WebPR の効果測定手法とは〜(11月18日)
スマートにソーシャルウェブを構築しよう
スマートにソーシャルウェブを構築しよう
社員力を生かすソーシャルメディアポリシー(11月17日)
DevX
DevX
Erlangを使った並列処理プログラムの作成(11月17日)
Copyright 2009 Japan Internet.com K.K. All Rights Reserved.http://www.internet.com/