japan.internet.com The Internet & IT Network


RSSニュース検索
カテゴリ
> トップページ
> Webビジネス
> Eコマース
> Webファイナンス
> Webマーケティング
> パブリック
> Webテクノロジー
> 携帯・ワイヤレス
> Linux Today
> Linux Tutorial
> J.I.C.ブログ
キャリア
> 転職ならen
> 派遣ならen
> アルバイトならen
> IT求人情報
ヘッドライン
> 今日のヘッドライン
> 週間ヘッドライン
Special Link
> 求人情報はe-aidem
> ロレックス
> 合宿免許
> フォトコミュニティ
> ストックフォト
> クリップアート
> イラスト
イベント&セミナー
> イベントカレンダー
> 書評「IT の耳」
> 出張・接待検索
> ニュースガジェット 注目
無料ニュースメール
> 新規登録
> 変更・解除
> オプトインメールの登録・変更・解除
インフォメーション
> パートナーサイト
転職ならエン
就職ならen
求人ならen
履歴書ならen
アルバイトならエン
CRM/SFAならオラクル
> 会社概要地図
> グループ会社
株式会社アエリア
(株)サンゼロミニッツ
株式会社エアネット
> お問い合わせ
> 広告掲載について
> リンクについて
> 著作権について
> その他お問い合わせ
> 利用規約
> 個人情報保護方針
Webテクノロジー 2003年11月14日 00:00
Webテクノロジー・バックナンバー
訪れたユーザーの足跡を解析する(1)

著者: (株)ネットエイジ melpod 開発チーム プリンター用 記事を転送
2003年11月14日 00:00 付の記事
国内internet.com発の記事
このエントリーを含むはてなブックマーク この記事をクリップ! Buzzurlにブックマーク Yahoo!ブックマークに登録 newsing it!

前回までの「メールで効果的な情報共有を行う(1)(2)」は、いかがでしたでしょうか?

今回から WWW にアクセスするためのしくみである HTTP プロトコルと Web サーバーに残されるアクセスログのしくみについて見てみいきましょう。多くのアクセス解析ソフトウェアはこのアクセスログから Web サイトを訪れたユーザーの足跡を探っていきます。

■WWWの歴史

まずはじめに WWW (World Wide Web) の歴史を振り返るとともに、みなさんお馴染みのブラウザで URL を入力する際の"http://" のルーツを見ていきましょう。

WWW は CERN (セルン:ヨーロッパ原子核研究機関)の論文閲覧システムとして開発したものが原点となっています。CERN の研究者達は、それまでは統一されていなかった報告書のフォーマットを統一し研究報告書を書き上げました。この研究報告書のフォーマットが HTML (Hypertext Markup Language) であり、この HTML を簡単に入手できるしくみが URI (Uniform Resource Identifiers) および HTTP (Hypertext Transfar Protocol) です。

CERN の物理学者 Tim Berners-Lee が WWW を提案したのが1989年3月であり、その時に HTTP や HTML の原型もできました。それらを広めたのは 1993年2月にイリノイ大学の NCSA(国立スーパーコンピュータ応用センター)が発表した Mosaic と呼ばれる Web ブラウザでした。

HTTP はバージョン 0.9から一般に公開されており、その後 1.0, 1.1 と辿ってきています。HTTP/1.0 は RFC 1945 で定義され、HTTP/1.1 は RFC 2616 で定義されています。ここでは、最新の HTTP/1.1 仕様に基づき説明します。なお、RFC (Request For Comments) についてはメール配送の仕組み(2)で説明しています。

■簡単HTTP

HTTP プロトコルは、HTTP クライアントソフトウェアから Web サーバーへの「リクエスト」と、「レスポンス」に対する Web サーバーからの「レスポンス」の送受信によって成立しています。

リクエストを送信する HTTP クライアントソフトウェアはユーザーエージェントと呼ばれます。ユーザーエージェントとして最もよく知られるプログラムは Microsoft Internet Explorer や Netscape 等の Web ブラウザや、サーチエンジン等が利用しているロボットやクローラーです。Web ブラウザは、HTTP サーバーに対してリクエストとして URL を送信しレスポンスとして返される HTML を HTML の言語仕様に基づき表示します。

ご存じ Web ページを表示するための言語である HTML は、この HTTP を通じて Web サーバーからブラウザに送られるわけです。

■足跡を追う仕組み

HTTP プロトコルについては多くの書籍や Web サイトで紹介されていますので、ここではHTMLをブラウザに表示させるための基本的なリクエストとレスポンスの仕組みを簡単に見ていきましょう。

リクエストは Request-Line と request-header から呼ばれる情報の単位から構成され、必要に応じて message-body が付加されます。

Request-Line は Method、Request-URI、HTTP-Version で構成され、静的な Web ページを表示する場合は Method に"GET"を指定します。

requeat-header には Host、User-Agent、Referer などの情報が格納されます。

Host はリクエストする Web サイトのホスト名とポート番号が格納されます。Host の後にポート番号の情報が無ければ、暗黙的にリクエストされるサービスのデフォルトポート (すなわち HTTP URL の場合は"80" です) を使用することを意味します。

User-Agent にはブラウザからのリクエストの場合、ブラウザを識別する文字列が含まれます。

【Google ロボットの User-Agent】
Googlebot/2.1 (+http://www.googlebot.com/bot.html)

【Microsoft Internet Explorer の User-Agent】
Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)

Referer は参照元の Web サイトを示します。すなわちリンクされている元の URL(URI) 情報を格納します。リンクではなくブラウザにて URL を入力した場合やメールに記載されている URL を入力した場合、 Referer はリクエストに含まれません。

例えば、melpod の製品紹介ページ "http://www.melpod.com/product/Product.html"にリクエストをする場合は以下のようになります。

GET /product/Product.html HTTP/1.1
Host: www.melpod.com
User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)

それではメール配送の仕組み(2)で説明した telnet コマンドを使って実際にリクエストとレスポンスを確認してみましょう。例として melpod のトップページである "http://www.melpod.com" にリクエストを送信してみます。

$ telnet www.melpod.com 80
Trying 192.168.0.25...
Connected to www.melpod.com.
Escape character is ’^]’.
GET / HTTP/1.1 <-入力後 Enter
host: www.melpod.com <-入力後 Enter
User-Agent: Tera Term <-入力後 Enterを2回

HTTP/1.1 200 OK <-ここからレスポンスが表示されます
Date: Tue, 11 Nov 2003 06:26:23 GMT
P3P: policyref="http://www.melpod.com/p3p/w3c/user.xml", CP="NOI CURa ADMa DEVaTAIa OUR DELa BUS IND ONL UNI PUR COM NAV STA"
Last-Modified: Fri, 07 Nov 2003 08:17:05 GMT
ETag: "6880d9-b670-3fab5501"
Accept-Ranges: bytes
Content-Length: 46704
Content-Type: text/html

この後には message-body(HTML 本文)が表示されますが省略します。

Connection closed by foreign host.

さて、上記のリクエストに対して、Web サーバーのアクセスログファイルを覗いてみると User-Agent に"Tera Term" が残っています。

2003/11/11 15:27:16 192.168.0.25 - - "GET / HTTP/1.1" 200 46704 "-" "Tera Term"

また、今回のテーマはレスポンスは大きく関係しませんが、レスポンスについて簡単に触れておきますと、レスポンスはリクエストに対する Web サーバーの処理状態を示す Status-Line と general-header, responce-header などの情報および HTML 本文などの message-body から構成されます。

このように ブラウザ(ユーザーエージェント)からのリクエストを、サイトを訪れるユーザーの足跡として Web サーバーのアクセスログファイルに保存しておくことによりサイトのアクセス解析に利用できます。現在多くのアクセス解析を行うパッケージソフトウェアや Web での ASP サービスは、このアクセスログを基に様々なグラフィカルな解析情報を表示しています。次回はこのアクセスログの内容と解析にについて詳しく説明します。

(執筆:後藤 康成)






関連記事
  • メールで効果的な情報共有を行う(2)
  • メールで効果的な情報共有を行う(1)
  • メール配送の仕組み(3)
  • メール配送の仕組み(2)
  • メール配送の仕組み(1)


  • 関連テーマ
  • アクセス解析
  • ブラウザ
  • Mozilla
  • Google


  • ★最新トップニュース
    国内 Adobe Flash Player 10 パブリックベータ版を公開(Webテクノロジー 5月16日 18:10)
    米国 Adobe Systems は、2008年5月15日、「Adobe Flash Player 10」(コードネーム:Astro)のパブリックベータ版を Adobe Labs で公開したことを発表した。
    国内 【今週の Web ミミズク】CBS の高価な買い物、グリッドは地球を救えるか、四川州地震のネット募金(Webファイナンス 5月16日 18:00)
    今週のビッグニュースは、なんといっても、CBS による CNET の買収だ。買収総額は18億ドル、だそうだが、この金額は高いか、安いか。
    国内 TI、WUXGA 対応の「.95 WUXGA DLP チップ」を発表、対応 DLP プロジェクタ製品も登場(Webテクノロジー 5月16日 17:50)
    Texas Instruments(TI)は、2008年5月13日、同社初となる1,920×1,200ピクセルの解像度を持つ WUXGA プロジェクタ向けの「.95 WUXGA DLP チップ」を発表した。
    国内 社会保険庁の国民年金保険料クレジットカード収納業務を GMO-PG が受託(パブリック - ニュース 5月16日 17:30)
    非対面クレジットカード決済事業を展開する、GMO ペイメントゲートウェイ株式会社(GMO-PG)は、2008年8月1日から2009年3月31日まで、社会保険庁の国民年金保険料のクレジットカード収納に係るカード番号管理等の業務を受託すると発表した。
    海外 【中国】中国移動、中国 TD 規格を5月末に 3.5G 規格にアップグレード(携帯・ワイヤレス 5月16日 17:00)
    5月15日、中国国内メディアの報道によれば、中国移動(チャイナ・モバイル)は5月末に TD 規格(TD-SCDMA:中国独自の 3G 通信規格)を3.5G 規格(TD-HSDPA)にアップグレードさせることを明らかにしたという。
    トピックス
    > オススメのIT系求人情報【毎週月曜日更新】
    footer_301.gif


    リサーチ
    > デイリーリサーチDLサイト
    > OnlineResearchPortal (リサーチデータバンク)
    > モバイルリサーチ with goo
    footer_301.gif
    キーワード
    > Youtube > BlackBerry
    > CGM > SaaS
    > アクセス解析 > LPO
    > テーマ一覧はこちら
    footer_301.gif
    セミナー情報
    > 第1回インターネットコムマーケティングセミナー「新規クライアントを効率的に獲得する Web マーケティング手法とは」(3月26日)多数のご参加ありがとうございました
    footer_301.gif
    デベロッパー
    > DevX
    > CodeGuru
    > developer.com
    footer_301.gif
    j.i.c.ブログ
    ブログ一覧
    Graphic Design Forum 【Graphic Design Forum】
    経済の混乱とフリーランス (5月16日)
    データメーション 【データメーション】
    IT 業界の女性について:(ハッと息をのむ)ある少女の観点(5月16日)
    ジュピターメディア創設者がITを斬る 【ジュピターメディア創設者がITを斬る】
    CNET が CBS に買収(5月16日)
    ベンチャー専門家の目利きブログ「なぜこの企業は伸びるのか?」 【ベンチャー専門家の目利きブログ「なぜこの企業は伸びるのか?」】
    「微生物、たんぱく質に隠された無限の可能性に挑戦!!」/株式会社サティス製薬(5月16日)
    japan.internet.com テクノログ 【japan.internet.com テクノログ】
    5月4日(日)〜5月10日(土)(5月13日)
    最新テクノロジーの意外な処方箋 【最新テクノロジーの意外な処方箋】
    アクセンチュア・テクノロジー・ラボプロジェクト:REST(Reducing Effort in Script-based Testingスクリプトテストの負荷軽減)(5月12日)
    footer_301.gif
    最新コラム一覧
    IT マネジメント IT マネジメント

    Steve Ballmer 氏が辞任すべき理由(5月16日)
    15 seconds 15 seconds

    AJAX SlideShowおよびTreeViewコントロールを使用してスライドショーを作成する(5月16日)
    最新アフィリエイト事例にみる成功の法則 最新アフィリエイト事例にみる成功の法則

    アフィリエイト市場動向(5月16日)
    最新ハイテク講座 最新ハイテク講座

    全自動からオゾンの力まで!ハイテク洗濯機の最新事情(5月16日)
    百式のネットビジネス研究 百式のネットビジネス研究

    手書き入力で中国語を検索できる辞書サイト「nciku」(5月16日)
    週刊-サイト別アクセス状況データ 週刊-サイト別アクセス状況データ

    ビデオリサーチインタラクティブ調査(月間インターネットオーディエンスデータ)(5月15日)
    「IT の耳」 「IT の耳」

    【書評】『ウェブを変える10の破壊的トレンド』(5月15日)
    検索エンジンマーケティング 検索エンジンマーケティング

    中国検索エンジン市場シェアを巡る攻防(5月15日)
    気になるオープンソースソフトウェア 気になるオープンソースソフトウェア

    オープンソースのアプリケーションサーバー Apache Geronimo(5月15日)
    気になるトレンド用語 気になるトレンド用語

    ネットの危機?自由が奪われる「青少年インターネット規制法案」(5月14日)
    footer_301.gif
    専門チャンネル
    > セキュリティチャネル > テレコムチャネル
    > サーチエンジンウォッチ
    footer_301.gif
    海外のインターネットコム アメリカ韓国ドイツトルコ
    関連企業のサイト:ストックフォト イラスト ネットストリート ホテル予約サイト タウン情報 出張 事業継承 シミュレーション トランクルーム 優待映画チケット 田舎暮らしガイド オリジナルTシャツ ニタコエ
    Copyright 2008 Jupitermedia Corporation All Rights Reserved. http://www.internet.com/
    space.gif space.gif