japan.internet.comThe Internet & IT Network
Twitter
RSS
  • ニュース
  • コラム
  • リサーチ
  • ヘッドライン
  • 特集
  • ブログ
  • プレスリリース
  • 専門チャンネル
  • イベント
  • ランキング
  • ニュースメール
2009年11月7日
文字サイズ文字サイズ小文字サイズ中文字サイズ大
任天堂が、大画面の「ニンテンドーDSi LL」を発表。欲しいと思いますか?
欲しい
欲しいと思わない
他のDS製品を持っているが欲しい
他のDS製品を持っているのでいらない
投票締切 11/9 12:00
Webビジネス2008年11月4日 10:00

数字のことを知っておく 〜数値としてのデータ〜

国内国内internet.com発の記事
  • Post to Twitter
  • Post to Facebook
  • このエントリーを含むはてなブックマーク
  • この記事をクリップ!
  • Buzzurlにブックマーク
  • Yahoo!ブックマークに登録
  • newsing it!
  • この記事をokyuuへインポート
Web サイトなどにたずさわっている人なら、アクセス解析やリスティング広告、SEO など、数字に触れることが多いと思う。アクセス解析などは、ソフトを使えば自動的に多角的な集計データが入手できる。リスティングであれば CTR、CPC、CPA などはいつでも分かる。

ただ、これらのデータは見るだけでは意味がなく、そうした数値から様々なことを読み取り、次の戦略に役立てることが重要なため、数字に強くなることが必要だ。今回は数値としてのデータについて基本的なことを説明する。

Web マーケティングと数値データ
Web マーケティングにおいてデータ処理ということをやっていると、統計の基本を忘れて無理矢理な数値の使い方をしている事に気づくことが多い。

たとえばリスティング広告のワードごとの平均掲載順位はそうである。統計を学んだものであればわかると思うが、「順序は平均を取らない」というのは統計を行う上では常識である(通常順序は中央値を取る、なぜなら一位と二位の間、二位と三位の間が等しいことは保証されていないからだ)。

自戒をこめてデータとしての数値の分類について確認をしたい。データとして数値を扱う場合の分類として「尺度(scale)」がある。尺度は名義尺度、順序尺度、間隔尺度、比例尺度(比率尺度)がある。また分析の際に着目すべき点としてデザインされているか否かという観点がある。

尺度での分類 〜名義尺度〜
単に名称として数値を割り振ったもの。スポーツ選手の背番号などがこれに当たり、この数値を計算することには意味が無い。背番号30番の江川卓が31番の掛布雅之よりも上位であるわけでも、背番号24の高橋 由伸が背番号8の谷佳知の3倍すごいわけでもない。

Webマーケティングではアンケートの際の項目番号が当たる。集計する際には項目1が何個(何回)、項目2が何個(何回)というように集計する。名義尺度のデータはカテゴリカルデータ(カテゴリーデータ)とも呼ばれ、通常の分析手法とは異なる分析手法が用いられる。

尺度での分類 〜順序尺度〜
数値同士の大小の比較だけができる数値。差が一定である保証はないもの。アテネ五輪の100m走の1位と2位も、北京五輪の100m走の1位と2位も同じ1位と2位として扱う(ちなみにアテネ五輪の100m走の1位と2位の差は0.01秒、北京五輪の100m走の1位と2位の差は0.20秒である)。

Webマーケティングでは検索順位、アンケートでの度合い比較(例:そう思う、どちらでもない、そうは思わない)で各項目に点数を割り振ったものがこれに当たる。

尺度での分類 〜間隔尺度〜
数値同士の大小の比較だけができ、差が一定であるもの。間隔尺度の例としては摂氏の温度がある。アンケートでの度合い比較(例:そう思う、どちらでもない、そうは思わない)で各項目に点数を割り振ったものでも、項目数が一定の数を超えていれば間隔尺度として扱ってもよいという解釈もある。ただしその分岐点も5段階でよいという立場もあれば7段階は必要だという立場もある。

マーケティング目的のリサーチの場合は「特にそう思う、そう思う、どちらでもない、そう思わない、まったくそう思わない」という感じの5段階で、間隔尺度の数値として扱うことが多い。

尺度での分類 〜比例尺度(比率尺度)〜
数値同士の大小の比較だけができ差が一定で、ゼロ原点をもつもの。多くの数値データはこれに当たる。温度でも絶対温度(単位はケルビン)であれば比例尺度である。

名義尺度、順序尺度をノンパラメトリックなデータ、間隔尺度、比例尺度をパラメトリックデータという呼び方をする場合もある。ノンパラメトリックデータとパラメトリックデータでは大きく扱う方法が異なる。

デザインされているか否か
数値化されたデータを用いる際に気をつけるべき点として、そのデータの所得方法が目的にフィットするようにデザインされているかということがある。

もっとも目的にフィットするようにデザインされたデータは実験によって得られたデータである。実験は結果にかかわりそうなデータをすべて統制し、ノイズ(解釈を混乱させる要因及びその影響)を考慮する必要がないように行うためである。

また、比較対照群を設定して行うため要因の効果が分かりやすい。例えば光の色が脳波に与える影響を測定する実験を行う場合、明るさや温度、時間帯を一定にして光の色のみが条件として変化するものとして状況設定をする。

LPO は実験の一種であるが厳密な条件統制を行わないのである程度のノイズが混入していると考えて分析に当たりたい。Webで行うアンケート調査も時間と場所を限定できない分のノイズは考慮すべきである。デザインされたデータを扱うときは、どのような意図でデザインされたかに気を使わなければならない。

これに比べてアクセス解析や売上げデータは分析のためにデザインされたデータではない。デザインされていないデータは多くの示唆に富むがノイズが多く、処理の仕方によっては考慮すべき知見が得られないこともある。

データの分析は料理に共通する所が多い、素材のよさ、クセを知ることで得られるものも多くなる。もし数値データに当たる機会にあったら、ここに記したことを少しでも思い出していただければ幸いである。

(執筆:株式会社ファンサイド AG マーケティング SEMスペシャリスト 杉山 征直)


  • プリンター用
  • 記事を転送
  • Post to Twitter
  • Post to Facebook
  • このエントリーを含むはてなブックマーク
  • この記事をクリップ!
  • BuzzurlにブックマークBuzzurlにブックマーク
  • Yahoo!ブックマークに登録
  • newsing it!
  • この記事をokyuuへインポート
最新トップニュース
プライバシー ジャパン・インターネットコム版
【プライバシー ジャパン・インターネットコム版】
認証がオンラインビジネスの鍵である理由(11月4日)
Copyright 2009 Japan Internet.com K.K. All Rights Reserved.http://www.internet.com/