【サイト管理】Web ログ解析−1トラフィック解析は、ユーザーがサイトのページを行ったり来たりする様を眺められるので、楽
しい仕事には違いないが、同時に情報過剰になる恐れもある。
私の会社では毎月クライアントの Web サイト ビジターのログをとっているが、それは実際に Web サイト自身が保有する情報量より約5、6倍も多い。 商品として販売されているログ解析ツールは、サイトの多くにとっては理想的ではない。 実際にソフトウェアを実行し、リレーショナル データベースと情報をやり取りするローカルサ イトのマシンで行う「ローカル」解析用のソフトウェアの値段は、200、300 ドルから4000、5000ドルする。 また、定期的に(場合によっては1時間ごとに)、解析とレポートを生成するリモートサイトに ログファイ ルを渡さなければならないような、NetCount とかInternet Profiles (I/Pro)といったサー ビスに、おそらく月何千ドルも支払わなければならなくなるだろう。 商品として販売されているツールが自分の会社の役に立つかどうかは、もっぱら、どの程度高度 にカスタマイズされた解析が必要であるかにかかっている。 かなり一般的な解析でいいのなら、ローカルサイトでデータ解析に使えるシンプルなシェアウェ アがたくさんある。 包括的にユニークビジターを解析するのなら、商用ツールに移行するか、あるいは社内で独自開 発してもいい。 このコラムでは、すでにあるリソースと、ここで紹介するコードのサンプルを使って、手っ取り 早く解析を行 う方法を紹介する。また、ユーザー解析用デイトスタンプの判読の仕方、サイト情報に関して、 アルゴリズムに沿った考え方を紹介する。最終的には商用ツールを選ぶことになるにせよ、予備 知識 はあるにこしたことはない。 ログフォーマット 何種類かのログフォーマットがあるが、ここでは、ほとんどの Web サイトが使っているCLF( Common Log Format)のみを扱う。 Open Market、Netscape、Microsoft Internet Information Server のようなサーバーはち ょっと違ったフォーマットで情報のログをとっているが、基本的には同じように機能する。 CLF のフィールドに加え、ビジターのブラウザによって明らかにされる情報があり、それは、 どんなユーザーがサイトを訪れているかが分かるので、ありがたい。
この3つのフィールドは、以下の例では、Inters? Extended Log Countにおいて、バ イトカウ ントに続いて現れる。 spaghetti.west.edu - - [30/Feb/1996:06:09:53 -0800] "GET/film/reviews/D/dangerous.minds.horton.html HTTP/1.0" 200 3828 "http://search.yahoo.com/bin/search?p=dangerous+minds" "Mozilla/1.22 (Windows; I; 32bit)" "211.63.0.255.8445454454" 私の会社では、CERN 3.0 サーバーがこのフォーマットに対応するようにしたが、それはほかの 目的にも 役立っている。 ビジットとは何か Web での広告販売の経験があるなら、広告におけるユニークインプレッションとは何か、とい う疑問にぶち当たったことがあるだろう。あるいは、もっと一般的に、ユニークビジットとは何 か。 これらが何を指すのか、かなり混乱しているようだ。普通にネットで使われる言葉を使って表現 すれば、次のようなことだろう。
ユーザーに登録を要求するサイトだと、LOGNAME 変数で、どんなログフォーマットだろうが、 (デイトスタンプとLOGNAME で)既存のユーザーのユニークビジットを追跡できる。ビジター に登録を要求しないサイトの場合、ユニークビジットを追跡する上で、多く分けて2つの選択肢 がある。
≫
最新トップニュース
|
|