japan.internet.com
E-コマース2003年2月17日 00:00
文字サイズ文字サイズ小文字サイズ中文字サイズ大

実用レベルに近づくテキストマイニング技術

この記事のURLhttp://japan.internet.com/ecnews/20030217/7.html
著者:佐藤 尚規
国内internet.com発の記事
 インターネットを活用することで、データベースマーケティングを高度化できるのではないかという期待は大きい。ウェブサイト経由で取得できるデータは、質・量とも従来のマーケティング活動で得られるものと大きく異なる。問題は、それらデータの活用である。

 定量的なデータから類似性や相関性を導き出すデータマイニングについては、かなり高度な手法が実用化されている。

 EC サイトへの応用としては、おすすめ商品を表示するレコメンデーションがあげられる。レコメンデーションには、人工知能の一つである「ニューラルネットワーク」から派生したコラボラティブ・フィルタリングという技術が利用されているが、ルールベースと呼ばれる類型化のテクニックを複雑にして、かつ自動的に行えるようにした技術と考えればいいだろう。

 一方、アンケートの自由回答などのテキスト形式のデータは、記入者の潜在ニーズが凝縮されているなど情報としての価値が高いものの、使われる用語の不統一性や日本語特有の主語と述語のあいまいな関係などが障害となり機械的に解析することは難しかった。このような定性的なデータを解析して、行間に潜む回答者の心理を読み取るのがテキストマイニング技術である。ここ数年でテキストマイニングの研究やソフトウェア開発が急速に進んでいる。

 これまで、訪問による聞き取り調査やグループインタビューなどで得られた定性的なデータは、分析者が一つ一つ読んで、KJ 法のように分類する方法などで分析されることが多かった。聞き取り調査などでは、1サンプルあたりの収集コストも高く、コスト面からも分析するデータの量が限られていたため、なんとか対応できていたという事情もある。

 しかし、インターネットで大量の定性的データが回収できるようになり、分析の対象となるテキスト形式のデータ量は飛躍的に増大した。1回のアンケートで収集される何千もの自由回答を分析者がすべてに目を通して従来の手法で分析することは不可能に近い。当然、テキストマイニングの実用化を望む声が高くなる。

 アンケート回答の分析以外にも、テキストマイニングの応用が期待されている分野は幅広い。すでに一部で実用化されているのは、企業が主催するコミュニティサイトで行きかうメールや掲示板の書き込みをマイニングして、消費者のニーズや現状の製品に対する不満点を分析し、商品開発に活かすというもの。

 CRM への応用例としては、メールによる顧客サポートを支援するシステムがある。サポートセンターに寄せられる質問の文意を自動的に解釈して、蓄積された膨大な対応マニュアルの中から、最もソリューションに関連していると思われる文書を抜き出してサポートスタッフに回送されるという仕組み。スタッフは、メールを開いた瞬間に、回答の際に役に立つと思われる情報が添付されているので、すぐに的確な返答ができる。

 翻訳やあいまい語検索など人工知能技術が高度化しつつある現状を考えると、テキストマイニング技術の実用化はすぐ目の前まで来ているといってもいいだろう。

記事提供:


japan.internet.comのウエブサイトの内容は全て、国際法、日本国内法の定める著作権法並びに商標法の規定によって保護されており、その知的財産権、著作権、商標の所有者はインターネットコム株式会社、インターネットコム株式会社の関連会社または第三者にあたる権利者となっています。
本サイトの全てのコンテンツ、テキスト、グラフィック、写真、表、グラフ、音声、動画などに関して、その一部または全部を、japan.internet.comの許諾なしに、変更、複製、再出版、アップロード、掲示、転送、配布、さらには、社内LAN、メーリングリストなどにおいて共有することはできません。
ただし、コンテンツの著作権又は所有権情報を変更あるいは削除せず、利用者自身の個人的かつ非商業的な利用目的に限ってのみ、本サイトのコンテンツをプリント、ダウンロードすることは認められています。

Copyright 2012 internet.com K.K. (Japan) All Rights Reserved.