japan.internet.comThe Internet & IT Network
Twitter
RSS
  • ニュース
  • コラム
  • リサーチ
  • ヘッドライン
  • 特集
  • ブログ
  • プレスリリース
  • 専門チャンネル
  • イベント
  • ランキング
  • ニュースメール
2009年11月7日
文字サイズ文字サイズ小文字サイズ中文字サイズ大
任天堂が、大画面の「ニンテンドーDSi LL」を発表。欲しいと思いますか?
欲しい
欲しいと思わない
他のDS製品を持っているが欲しい
他のDS製品を持っているのでいらない
投票締切 11/9 12:00
Webビジネス2008年10月6日 10:00

DB マーケティングと Web マーケティング 〜ビールとオムツの伝説から〜

国内国内internet.com発の記事
  • Post to Twitter
  • Post to Facebook
  • このエントリーを含むはてなブックマーク
  • この記事をクリップ!
  • Buzzurlにブックマーク
  • Yahoo!ブックマークに登録
  • newsing it!
  • この記事をokyuuへインポート
ビールとオムツの伝説
DB マーケティングを語るときよく引き合いに出される話に、ウォルマートの「缶ビールと紙おむつ」の話がある。

とても有名な話なので改めて話すこともないとも思うが、念のために書くと“ある日、購買データを見ていたウォルマートのバイヤーが、同時購買の傾向の中に面白い特徴があるものを見つけた。缶ビールのケースと紙おむつが同時に購買されているのだ。そして実際に店舗でその理由を探ると、若い父親が車で郊外の店舗にビールを買いに来たとき、奥さんに頼まれたのか、ついでに紙おむつを買っていくことが分かった。そこで、缶ビールのケースを買う動線の中に紙おむつを置いたら、紙おむつの売上げが増えた”というものである。

この話で不思議に思う点が一点。どうやってウォルマートほどの大規模な購買データから、「缶ビールと紙おむつ」のデータを発見することが出来たのであろうか。

ここで、もう一つの話。某巨大 EC サイトで商品の詳細情報を見ると、当該商品を買った人がどのようなものも買っているか、「この商品を買った人はこんな商品も買っています」というカタチで教えてくれる。さてここで不思議なのは、ある野球漫画の1巻を買った人が第2巻を買うのと、大人気の他の野球漫画の1巻を買うのとどちらが回数として多いか、大抵の方が即答に困ると思われるのだがどうだろうか。

実際の関連から考えれば2巻目と考えるのが普通である。しかし、多くの人に読まれている、しかも同じジャンルの漫画であれば、もしかしたらということも考えられる。しかし、「この商品を買った人はこんな商品も買っています」に並ぶのは同一タイトルか同じ作者のものがほとんどである。さて、どうしたらこのように点数約1,000万アイテムと言われている某巨大 EC サイトで自動的に、できるだけ納得の行く形で、なるべくシステムに負担をかけずに関連の深い商品を抜き出すことができるだろうか。これはデータマイニングのアソシエーション分析を活用することによって可能になるのである。

以下アソシエーション分析について解説する。

アソシエーション分析の基本的な考え方
アソシエーション分析とは、多量のデータの中から意味のあるルールを見つけ出す分析方法である。例えば、スーパーマーケットの POS データを分析し、「パンとバターを購入した取引の○○%が牛乳も購入している」といったルールを見つけ出すなど。まず確率の基礎の復習として、

1問目:1個のサイコロで1の目が出る確率は?
1/6である。では、

2問目:コンビニでカップ麺が買われる確率は20%、電池が買われる確率は10%、このときカップ麺と電池が一緒に買われる確率は?
20%×10%で2%である。もちろん、カレールーとこま切れのお肉のように同時購買されるような関連性が、全く無いという前提の元での計算である。

具体的な簡単な事例を挙げて説明する。東京都と大阪府の住民全員に「あなたは阪神タイガースのファンですか」という質問をしたと仮定する。2005年の国勢調査の値から東京都と大阪府の人口の比は4:3であるが計算しやすいよう、便宜的に3:2とする。また、阪神タイガースのファンである確率は17.7%(2005年 大阪府立大学 宮本勝浩教授 発表)なので、便宜上20%とする。そうすると下の状況が導き出される。

・東京都民で阪神ファン   60%×20%=12%
・東京都民で阪神ファン以外   60%×80%=48%
・大阪府民で阪神ファン   40%×20%=8%
・大阪府民で阪神ファン以外   40%×80%=32%

住んでいる地域と、応援している球団の間に関連がないとすれば上記のような比率になるわけなのだが、ある程度プロ野球について分かっている方なら、なんだか違和感があるはずである。「大阪府民で阪神ファン」が8%のはずはない。そうしたところに新たな傾向の発見がある。

・東京都民で阪神ファン   12%
・東京都民で阪神ファン以外   48%
・大阪府民で阪神ファン   32%
・大阪府民で阪神ファン以外   8%

おおよそこんな感じかなというところで出した値だが、先に算出されたものよりも腑に落ちると思われる。こうすると「大阪府民で阪神ファン」となると実測値が算出した値(これを期待値と呼ぶ:以降期待値と標記)を超える。これはもちろん既知の事実として、阪神タイガースという球団が大阪府の地元の球団(厳密には兵庫県であるが)として大きな人気があるということが分かっているので、実測値と期待値の違いについても説明が出来るわけである。

分かりやすく言うと、アソシエーション(相関)ルールを想定して実際のデータと見比べ、そこに想定したルールと違うところを発見し分析することで、別視点での考え方や改善点などを導くことができるのである。これと同じことが「缶ビールと紙おむつ」、「同じ野球漫画の1巻と2巻目以降」にも当てはまる。特に「缶ビールと紙おむつ」の場合は当該2アイテムの関連の深いことが分かるのが先で、その理由は後の調査で初めて明らかになった。

アソシエーションルールの応用
このように多くの事象の組み合わせの中から本当に関連の深い事柄を浮かび上がらせる手法として、アソシエーションルールはとても有用である。

Webマーケティングの分野では以下の分野で応用が出来る。

・流入キーワードとコンテンツの関連(例:流入キーワードと商品ページの関連)
・例)キーワードごとのコンテンツ導線を分析して SEO 対策に活用
・リンク元サイトとコンテンツの関連
・例)リンク元サイトとコンテンツ導線を分析して LPO 対策に活用
・広告媒体とコンテンツの関連
・例)広告媒体からの流入とコンテンツ導線を分析して広告の効果検証・改善に活用
・検索エンジンと流入キーワードの関連 などなど
・例)検索エンジンと流入キーワードの分析によりリスティング広告戦略に活用

ただし、アソシエーション分析を行った場合、その結果が当たり前のものである場合が多く、新規の傾向の発見につながらない場合が多々ある。これは、ダイヤモンドの鉱脈を発見しても、その鉱石から取れる実際のダイヤモンドがごくわずかだということと何か似ている感じがして面白い。

そして、希少なルールが発見できれば成果の有用性は高く、上記の簡単な算出法でなら表計算ソフトでも計算できるくらいの分析法なので、試してみる価値は大いにある。

(執筆:株式会社ファンサイド AG マーケティング SEM スペシャリスト 杉山 征直)


関連テーマ
  • プリンター用
  • 記事を転送
  • Post to Twitter
  • Post to Facebook
  • このエントリーを含むはてなブックマーク
  • この記事をクリップ!
  • BuzzurlにブックマークBuzzurlにブックマーク
  • Yahoo!ブックマークに登録
  • newsing it!
  • この記事をokyuuへインポート
最新トップニュース
プライバシー ジャパン・インターネットコム版
【プライバシー ジャパン・インターネットコム版】
認証がオンラインビジネスの鍵である理由(11月4日)
Copyright 2009 Japan Internet.com K.K. All Rights Reserved.http://www.internet.com/