japan.internet.comThe Internet & IT Network
Twitter
RSS
  • ニュース
  • コラム
  • リサーチ
  • ヘッドライン
  • 特集
  • ブログ
  • プレスリリース
  • 専門チャンネル
  • イベント
  • ランキング
  • ニュースメール
2009年11月22日
文字サイズ文字サイズ小文字サイズ中文字サイズ大
事業仕分けによる次世代スーパーコンピューターの開発予算削減について、どうお考えですか?
賛成
反対
どちらとも言えない
投票締切 11/30 12:00
E-コマース2003年2月17日 00:00

実用レベルに近づくテキストマイニング技術

国内国内internet.com発の記事
  • Post to Twitter
  • Post to Facebook
  • このエントリーを含むはてなブックマーク
  • この記事をクリップ!
  • Buzzurlにブックマーク
  • Yahoo!ブックマークに登録
  • newsing it!
  • この記事をokyuuへインポート
 インターネットを活用することで、データベースマーケティングを高度化できるのではないかという期待は大きい。ウェブサイト経由で取得できるデータは、質・量とも従来のマーケティング活動で得られるものと大きく異なる。問題は、それらデータの活用である。

 定量的なデータから類似性や相関性を導き出すデータマイニングについては、かなり高度な手法が実用化されている。

 EC サイトへの応用としては、おすすめ商品を表示するレコメンデーションがあげられる。レコメンデーションには、人工知能の一つである「ニューラルネットワーク」から派生したコラボラティブ・フィルタリングという技術が利用されているが、ルールベースと呼ばれる類型化のテクニックを複雑にして、かつ自動的に行えるようにした技術と考えればいいだろう。

 一方、アンケートの自由回答などのテキスト形式のデータは、記入者の潜在ニーズが凝縮されているなど情報としての価値が高いものの、使われる用語の不統一性や日本語特有の主語と述語のあいまいな関係などが障害となり機械的に解析することは難しかった。このような定性的なデータを解析して、行間に潜む回答者の心理を読み取るのがテキストマイニング技術である。ここ数年でテキストマイニングの研究やソフトウェア開発が急速に進んでいる。

 これまで、訪問による聞き取り調査やグループインタビューなどで得られた定性的なデータは、分析者が一つ一つ読んで、KJ 法のように分類する方法などで分析されることが多かった。聞き取り調査などでは、1サンプルあたりの収集コストも高く、コスト面からも分析するデータの量が限られていたため、なんとか対応できていたという事情もある。

 しかし、インターネットで大量の定性的データが回収できるようになり、分析の対象となるテキスト形式のデータ量は飛躍的に増大した。1回のアンケートで収集される何千もの自由回答を分析者がすべてに目を通して従来の手法で分析することは不可能に近い。当然、テキストマイニングの実用化を望む声が高くなる。

 アンケート回答の分析以外にも、テキストマイニングの応用が期待されている分野は幅広い。すでに一部で実用化されているのは、企業が主催するコミュニティサイトで行きかうメールや掲示板の書き込みをマイニングして、消費者のニーズや現状の製品に対する不満点を分析し、商品開発に活かすというもの。

 CRM への応用例としては、メールによる顧客サポートを支援するシステムがある。サポートセンターに寄せられる質問の文意を自動的に解釈して、蓄積された膨大な対応マニュアルの中から、最もソリューションに関連していると思われる文書を抜き出してサポートスタッフに回送されるという仕組み。スタッフは、メールを開いた瞬間に、回答の際に役に立つと思われる情報が添付されているので、すぐに的確な返答ができる。

 翻訳やあいまい語検索など人工知能技術が高度化しつつある現状を考えると、テキストマイニング技術の実用化はすぐ目の前まで来ているといってもいいだろう。

記事提供:



  • プリンター用
  • 記事を転送
  • Post to Twitter
  • Post to Facebook
  • このエントリーを含むはてなブックマーク
  • この記事をクリップ!
  • BuzzurlにブックマークBuzzurlにブックマーク
  • Yahoo!ブックマークに登録
  • newsing it!
  • この記事をokyuuへインポート
最新トップニュース
Graphic Design Forum
【Graphic Design Forum】
流動的媒体と静的媒体に関する見解(11月18日)
「IT の耳」
「IT の耳」
【書評】『Hyper-V スタートアップバイブル』――仮想化についてのすぐれた解説書(11月20日)
百式のネットビジネス研究
百式のネットビジネス研究
世界でもっともパワフルな iPod のスピーカー「Wall of Sound」(11月20日)
週刊-サイト別アクセス状況データ
週刊-サイト別アクセス状況データ
ビデオリサーチインタラクティブ調査(月間インターネットオーディエンスデータ)(11月19日)
海外ソーシャルウェブに学ぶ成功の秘訣
海外ソーシャルウェブに学ぶ成功の秘訣
ゲーム業界を襲う世界的な激震。ソーシャルゲーム急成長のインパクト(11月19日)
今さら聞けない初歩からのアクセス解析
今さら聞けない初歩からのアクセス解析
サイトリニューアル前のアクセス解析活用法(11月19日)
成約率、反応率を上げる Web 文章術
成約率、反応率を上げる Web 文章術
文章力を磨き、キャッシュを生み出す Web サイト に(11月19日)
「Webからの脅威」―その傾向と最新対策
「Webからの脅威」―その傾向と最新対策
新たな対策技術:スパムフィルタリングと E-mail レピュテーション(11月18日)
ROI向上のための戦略的WebPR
ROI向上のための戦略的WebPR
「戦略的 WebPR」のしかけ方〜WebPR の効果測定手法とは〜(11月18日)
スマートにソーシャルウェブを構築しよう
スマートにソーシャルウェブを構築しよう
社員力を生かすソーシャルメディアポリシー(11月17日)
DevX
DevX
Erlangを使った並列処理プログラムの作成(11月17日)
Copyright 2009 Japan Internet.com K.K. All Rights Reserved.http://www.internet.com/