japan.internet.com The Internet & IT Network


RSSニュース検索
カテゴリ
> トップページ
> Webビジネス
> Eコマース
> Webファイナンス
> Webマーケティング
> パブリック
> Webテクノロジー
> 携帯・ワイヤレス
> Linux Today
> Linux Tutorial
> J.I.C.ブログ
キャリア
> 転職ならen
> 派遣ならen
> アルバイトならen
> IT求人情報
ヘッドライン
> 今日のヘッドライン
> 週間ヘッドライン
Special Link
> フォトコミュニティ
> ストックフォト
> クリップアート
> イラスト
> フェリカ
> Web2.0
> 写真
イベント&セミナー
> イベントカレンダー
> 書評「IT の耳」
> 出張・接待検索
> ニュースガジェット 注目
無料ニュースメール
> 新規登録
> 変更・解除
> オプトインメールの登録・変更・解除
インフォメーション
> パートナーサイト
転職ならエン
就職ならen
求人ならen
履歴書ならen
アルバイトならエン
CRM/SFAならオラクル
> 会社概要地図
> グループ会社
株式会社アエリア
株式会社Ajax Net
株式会社エアネット
株式会社ゲームポット
> お問い合わせ
> 広告掲載について
> リンクについて
> 著作権について
> その他のお問い合わせ
> 利用規約
> プライバシーポリシー

最新コラム

訪れたユーザーの足跡を解析する(2)

著者: (株)ネットエイジ melpod 開発チーム プリンター用 記事を転送
2003年11月26日 00:00 付の記事
国内internet.com発の記事

前回はブラウザ(ユーザーエージェント)から送信される HTTP のリクエストの情報について説明しましたがいかがでしたでしょうか? 今回はブラウザ(ユーザーエージェント)から送信されたリクエストは Web サーバーでどのように保存されるかを見ていきましょう。

■Web サーバーのログ

Web サーバーソフトウェアの種類は数多くありますが、ここでは世界的に最も多く利用されているオープンソース ソフトウェアの Web サーバーである Apache *1 を例にとって見ていきましょう。

Apache ではさまざまなログ形式がサポートされます。デフォルトでは共通ログ形式(Common Log Format)でデータは書き込まれますが、LogFormat 指示子により形式をカスタマイズすることも可能です。

デフォルトの LogFormat 指示子
        
%h ホスト名 訪問者のIPアドレスまたはドメイン名
%l 識別情報 クライアントについての識別情報
%u 認証ユーザー 基本HTTP認証が必要な場合の認証済みユーザー名
%t 日時 リクエストの日時
%r リクエスト 送信してきたリクエストの内容。この部分は、"と"で囲まれる。
%s ステータス

クライアントに送信されたHTTPステータスコード

*ステータス区分
100番台:情報
200番台:成功
300番台:転送
400番台:エラー(アクセスする側の問題)

%b バイト数 クライアントに送信されたファイルやオブジェクトのサイズ


カスタムログ形式として利用される LogFormat 指示子

%f リクエストされたファイル名
%{variable}e 環境変数variableの内容
%a リクエストを送信してきたコンピュータのリモートIPアドレス
%{IncomingHeader}i サーバーに送信されてきたリクエストのヘッダー行
%{variable}n 別のモジュールの注釈valiableの内容
%{OutgoingHeader}o 応答のヘッダー行
%p リクエストに応えるサーバーのポート
%P リクエストに応えた子プロセスID
%{format}t format書式に従って表現された時間
%T リクエストに応えるために要した時間(秒)
%U リクエストされたURLパス
%v リクエストの送信先となったサーバーの名前
%V UseCanonicalNameの設定に応じて、リクエストの送信先となったサーバーの名前を示す


これらの指示子を組み合わせ、ダブルクオーテーションで囲んで指定すれば、望みどおりの書式でログを記録できます。ありがたいことに、必要そうな書式はあらかじめ Apache の開発者側で httpd.conf 設定ファイルにあらかじめ用意されています。

■共通ログ形式

共通ログ形式(common)では7つのトークン(データフィールド)が空白により区切られ、以下の形式で情報を表示します。

・表示順
ホスト名 識別情報 認証ユーザー 日時 リクエスト ステータス バイト数

・指定方法
LogFormat "%h %l %u %t "%r" %s %b"

・ログ出力の例
192.168.100.xxx - - [01/Nov/2003:18:26:23 +0900] "GET http://www.melpod.com/index.html HTTP/1.0" 200 18167

■combined 形式

サイトを訪れたユーザーの詳細な足跡を追うためには、カスタムログ形式を設定して参照元ページである Referer と User Agent を取得する combined 形式を指定する場合が多いようです。

・表示順
ホスト名 識別情報 認証ユーザー 日時 リクエスト ステータス バイト数 リファラー ユーザーエージェント

・指定方法
LogFormat "%h %l %u %t "%r" %>s %b "%{Referer}i" "%{User-Agent}i"" combined

・ログ出力の例
210.197.104.30 - - [24/Nov/2003:22:27:06 +0900] "GET /index.html HTTP/1.0" 200 17319 "http://www.netage.co.jp/" "Mozilla/4.0 (compatible; MSIE 6.0; Windows 98; Win 9x 4.90; T312461)"

combined 形式のログ出力の例をみてわかるように、ブラウザ(ユーザーエージェント)からの1リクエストに対して1行のログが出力されます。それではこの combined 形式のログを例にとってユーザーの足跡を実際に辿ってみましょう。

「このユーザーは日本時間の2003年11月24日22時27分に 210.197.104.30 から Windows 98 の Microsoft Internet Explorer で index.html へアクセスしてきており。参照元は www.netage.co.jp です。」

このようにユーザーの残した足跡の詳細は Web サーバーのログファイルとして克明に残されます。あとはこの残したログをどのように解析するかによって、サイトアクセスの状態を知る上であなたの必要な情報を引き出すことができます。

例えば、あなたのサイトのどのページが一番アクセスされているか、あなたのサイトへはどのサイトからのアクセスが一番多いかなど、様々なサイト統計データが得られます。

ログを解析するためのログ解析ツールには様々なソフトウェアが存在します。さて、次回はこのログデータを利用した、サイトのログ解析について説明したいと思います。

*1 Apache Jakarta Project
http://jakarta.apache.org/

(執筆:後藤 康成)




過去コラム集
訪れたユーザーの足跡を解析する(1)
メールで効果的な情報共有を行う(2)
メールで効果的な情報共有を行う(1)
メール配送の仕組み(3)
メール配送の仕組み(2)
メール配送の仕組み(1)
海外のインターネットコム アメリカ韓国ドイツトルコ
関連企業のサイト:ストックフォト イラスト ネットストリート ホテル予約サイト タウン情報 出張 事業継承 シミュレーション トランクルーム 優待映画チケット 田舎暮らしガイド オリジナルデザインTシャツ ニタコエ
Copyright 2008 Jupitermedia Corporation All Rights Reserved. http://www.internet.com/
space.gif space.gif