japan.internet.comThe Internet & IT Network
RSS
  • ニュース
  • コラム
  • リサーチ
  • ヘッドライン
  • 特集
  • ブログ
  • プレスリリース
  • 専門チャンネル
  • イベント
  • ランキング
  • ニュースメール
2009年7月4日
文字サイズ文字サイズ小文字サイズ中文字サイズ大
Webビジネス2008年11月4日 10:00

数字のことを知っておく 〜数値としてのデータ〜

国内国内internet.com発の記事
  • このエントリーを含むはてなブックマーク
  • この記事をクリップ!
  • Buzzurlにブックマーク
  • Yahoo!ブックマークに登録
  • newsing it!
  • この記事をokyuuへインポート
Web サイトなどにたずさわっている人なら、アクセス解析やリスティング広告、SEO など、数字に触れることが多いと思う。アクセス解析などは、ソフトを使えば自動的に多角的な集計データが入手できる。リスティングであれば CTR、CPC、CPA などはいつでも分かる。

ただ、これらのデータは見るだけでは意味がなく、そうした数値から様々なことを読み取り、次の戦略に役立てることが重要なため、数字に強くなることが必要だ。今回は数値としてのデータについて基本的なことを説明する。

Web マーケティングと数値データ
Web マーケティングにおいてデータ処理ということをやっていると、統計の基本を忘れて無理矢理な数値の使い方をしている事に気づくことが多い。

たとえばリスティング広告のワードごとの平均掲載順位はそうである。統計を学んだものであればわかると思うが、「順序は平均を取らない」というのは統計を行う上では常識である(通常順序は中央値を取る、なぜなら一位と二位の間、二位と三位の間が等しいことは保証されていないからだ)。

自戒をこめてデータとしての数値の分類について確認をしたい。データとして数値を扱う場合の分類として「尺度(scale)」がある。尺度は名義尺度、順序尺度、間隔尺度、比例尺度(比率尺度)がある。また分析の際に着目すべき点としてデザインされているか否かという観点がある。

尺度での分類 〜名義尺度〜
単に名称として数値を割り振ったもの。スポーツ選手の背番号などがこれに当たり、この数値を計算することには意味が無い。背番号30番の江川卓が31番の掛布雅之よりも上位であるわけでも、背番号24の高橋 由伸が背番号8の谷佳知の3倍すごいわけでもない。

Webマーケティングではアンケートの際の項目番号が当たる。集計する際には項目1が何個(何回)、項目2が何個(何回)というように集計する。名義尺度のデータはカテゴリカルデータ(カテゴリーデータ)とも呼ばれ、通常の分析手法とは異なる分析手法が用いられる。

尺度での分類 〜順序尺度〜
数値同士の大小の比較だけができる数値。差が一定である保証はないもの。アテネ五輪の100m走の1位と2位も、北京五輪の100m走の1位と2位も同じ1位と2位として扱う(ちなみにアテネ五輪の100m走の1位と2位の差は0.01秒、北京五輪の100m走の1位と2位の差は0.20秒である)。

Webマーケティングでは検索順位、アンケートでの度合い比較(例:そう思う、どちらでもない、そうは思わない)で各項目に点数を割り振ったものがこれに当たる。

尺度での分類 〜間隔尺度〜
数値同士の大小の比較だけができ、差が一定であるもの。間隔尺度の例としては摂氏の温度がある。アンケートでの度合い比較(例:そう思う、どちらでもない、そうは思わない)で各項目に点数を割り振ったものでも、項目数が一定の数を超えていれば間隔尺度として扱ってもよいという解釈もある。ただしその分岐点も5段階でよいという立場もあれば7段階は必要だという立場もある。

マーケティング目的のリサーチの場合は「特にそう思う、そう思う、どちらでもない、そう思わない、まったくそう思わない」という感じの5段階で、間隔尺度の数値として扱うことが多い。

尺度での分類 〜比例尺度(比率尺度)〜
数値同士の大小の比較だけができ差が一定で、ゼロ原点をもつもの。多くの数値データはこれに当たる。温度でも絶対温度(単位はケルビン)であれば比例尺度である。

名義尺度、順序尺度をノンパラメトリックなデータ、間隔尺度、比例尺度をパラメトリックデータという呼び方をする場合もある。ノンパラメトリックデータとパラメトリックデータでは大きく扱う方法が異なる。

デザインされているか否か
数値化されたデータを用いる際に気をつけるべき点として、そのデータの所得方法が目的にフィットするようにデザインされているかということがある。

もっとも目的にフィットするようにデザインされたデータは実験によって得られたデータである。実験は結果にかかわりそうなデータをすべて統制し、ノイズ(解釈を混乱させる要因及びその影響)を考慮する必要がないように行うためである。

また、比較対照群を設定して行うため要因の効果が分かりやすい。例えば光の色が脳波に与える影響を測定する実験を行う場合、明るさや温度、時間帯を一定にして光の色のみが条件として変化するものとして状況設定をする。

LPO は実験の一種であるが厳密な条件統制を行わないのである程度のノイズが混入していると考えて分析に当たりたい。Webで行うアンケート調査も時間と場所を限定できない分のノイズは考慮すべきである。デザインされたデータを扱うときは、どのような意図でデザインされたかに気を使わなければならない。

これに比べてアクセス解析や売上げデータは分析のためにデザインされたデータではない。デザインされていないデータは多くの示唆に富むがノイズが多く、処理の仕方によっては考慮すべき知見が得られないこともある。

データの分析は料理に共通する所が多い、素材のよさ、クセを知ることで得られるものも多くなる。もし数値データに当たる機会にあったら、ここに記したことを少しでも思い出していただければ幸いである。

(執筆:株式会社ファンサイド AG マーケティング SEMスペシャリスト 杉山 征直)


このエントリーを含むはてなブックマーク この記事をクリップ!
BuzzurlにブックマークBuzzurlにブックマーク Yahoo!ブックマークに登録
この記事をokyuuへインポート
最新トップニュース
データメーション
【データメーション】
中国が「Green Dam」フィルタ規制を撤回(7月1日)
Graphic Design Forum
【Graphic Design Forum】
Chris Dickman(6月25日)
プライバシー ジャパン・インターネットコム版
【プライバシー ジャパン・インターネットコム版】
グーグル・ストリートビューの問題について総務省の見解(6月23日)
エンジニアの独り言
【エンジニアの独り言】
システムを「使う」時代のエンジニアに求められるもの(6月2日)
最新ハイテク講座
最新ハイテク講座
電気は家庭でつくる時代へ!燃料電池「エネファーム」(7月3日)
アクセス解析で見るWebマーケティング
アクセス解析で見るWebマーケティング
決定力を探るアクセス解析(7月3日)
百式のネットビジネス研究
百式のネットビジネス研究
ファーストフードを高級っぽく盛り付けて紹介している「Fancy Fast Food」(7月3日)
週刊-サイト別アクセス状況データ
週刊-サイト別アクセス状況データ
ビデオリサーチインタラクティブ調査(月間インターネットオーディエンスデータ)(7月2日)
成約率、反応率を上げる Web 文章術
成約率、反応率を上げる Web 文章術
言葉がダイレクトにキャッシュを生む(7月2日)
不況時代の Web ビジネス最適化講座
不況時代の Web ビジネス最適化講座
アクセス解析エキスパートここだけの話、Web コンシェルジュの“勉強法”こっそり教えます(7月2日)
「Webからの脅威」―その傾向と最新対策
「Webからの脅威」―その傾向と最新対策
不正プログラムの分類(7月1日)
DevX
DevX
JavaScriptとDOMによる動的なWebページの作成(6月30日)
エンジニア転職ノウハウ開発室
エンジニア転職ノウハウ開発室
今のままで大丈夫?3匹の子ブタ的キャリア危険度診断(6月30日)
アイレップの SEM フロンティア
アイレップの SEM フロンティア
Web サイトは「無駄な穴のたくさん開いたじょうご」〜サイト成果向上の基本的な考え方(6月30日)
Copyright 2009 Japan Internet.com K.K. All Rights Reserved.http://www.internet.com/