japan.internet.com The Internet & IT Network


RSSニュース検索
カテゴリ
> トップページ
> Webビジネス
> Eコマース
> Webファイナンス
> Webマーケティング
> パブリック
> Webテクノロジー
> 携帯・ワイヤレス
> Linux Today
> Linux Tutorial
> J.I.C.ブログ
キャリア
> 転職ならen
> 派遣ならen
> アルバイトならen
> IT求人情報
ヘッドライン
> 今日のヘッドライン
> 週間ヘッドライン
Special Link
> フォトフェイシャル
> ゴルフ用品なら
> レンタルサーバ
> ドミノ・ピザ
> フォトコミュニティ
> ストックフォト
> クリップアート
イベント&セミナー
> イベントカレンダー
> 書評「IT の耳」
> 出張・接待検索
> ニュースガジェット 注目
無料ニュースメール
> 新規登録
> 変更・解除
> オプトインメールの登録・変更・解除
インフォメーション
> パートナーサイト
転職ならエン
就職ならen
求人ならen
履歴書ならen
アルバイトならエン
CRM/SFAならオラクル
> グループ会社
株式会社アエリア
(株)サンゼロミニッツ
株式会社エアネット
> お問い合わせ
> 広告掲載について
> リンクについて
> 著作権について
> その他お問い合わせ
> 利用規約
> 個人情報保護方針
> 会社概要地図
Webビジネス 2008年3月14日 10:00
Webビジネス・バックナンバー
これだけは知っておきたい検索技術

著者: 株式会社アイレップ プリンター用 記事を転送
2008年3月14日 10:00 付の記事
国内internet.com発の記事
このエントリーを含むはてなブックマーク この記事をクリップ! Buzzurlにブックマーク Yahoo!ブックマークに登録 newsing it!

液晶テレビを思い浮かべてみよう。私たち消費者は液晶テレビを通じてテレビ番組や DVD などの映像を見て楽しんだりするわけだが、それをするために必要なことはテレビの電源の入れ方やチャンネルの換え方、DVD との接続方法などであって、液晶テレビが映像を映し出す仕組みを必ずしも知っている必要はない。つまり、対象物の仕組みや構造を知ることと、それを利用するために要求される知識は全く異なるということだ。しかしながら、対象物のことをより詳しく知り、特性を理解することで、より上手に活用できることもある。

普段、Google や Yahoo!などの自然検索から効率的にターゲットユーザーの誘導をはかろうと SEO に取り組む企業担当者は、とりわけ「如何にあのキーワードで検索1位にするか」ばかりを考えているかも知れないが、あちら側 - 検索エンジンがどのような仕組みで動き、何を考えて検索結果を作っているかを理解することにより、SEO の戦略の立て方や適切な取り組み方法が見えてくることもある。今回は、検索エンジンの基本的な技術の仕組みを押さえつつ、SEO のあり方について考えてみよう。

■検索エンジンを構成する要素

検索エンジンを構成する要素は大きく分けて3つ。ネット上に膨大に存在する Web ページの情報を集める「クロール」、集めた情報から索引を作成し情報を引き出せるように整理する「インデックス」、そしてユーザーからの検索要求に対して検索結果を出すまでのプロセス「クエリプロセス」だ。以下、1つずつ解説しよう。

1.クロール

検索対象となる Web ページをはじめとするネット上に散らばるコンテンツを集める役割となるのがクローリングだ。それらを集める収集ロボットはクローラー(crawler)またはスパイダー(spider)とも呼ばれるが、Web ページを結びつけるリンク構造(link structure)を辿りながら数十、数百億の Web ページを次々と集めていく。

ロボット型検索エンジン(人の手を介さない、アルゴリズムで処理する検索エンジン)は基本的に Web ページの収集を検索会社が人力で行ったりしない。

2.インデックス

クロールのプロセスを通じて収集した情報は、集めただけでは意味がない。これは検索エンジンであり、世の中の数千万人もの人々が常時、キーワードという媒介を使って検索要求をする。検索要求に対して答えを返す(検索結果を表示する)まで分、時間単位で待たされていてはイライラして誰も利用しないだろう。

数秒未満で答えを返すために、検索しやすいように書籍の巻頭や巻末についた索引(さくいん)のようなものをあらかじめ作成しておくのだ。これがインデックスだ。Google や Yahoo!は2008年3月現在、インデックスのサイズを公表していないが数百億単位のインデックスを持つといわれている。

3. クエリプロセス

ユーザーからの検索要求に対して、インデックスの中からキーワードに合致する Web ページの文書を素早く見つけ出し、一覧リストを作成して検索結果を表示するまでのプロセスだ。ところで、単にキーワードを含む Web ページをランダムに表示しても意味はない。ユーザーが入力したキーワードは、ほしいと思った情報の断片を言葉で具現化したに過ぎず、それに該当する、ユーザーにとって有益な、望んでいた情報を返す必要がある。

そこで検索エンジンは、単に当該キーワードを含むだけでなく、適合性が高く、関連し、より信頼できる Web ページから順番に並び替えてあげる必要がある。つまり、Web ページの適合度や重要性、信頼性などをスコアリング(重み付け)し、ランキング表示する必要がある。ユーザーが望み、すぐに必要とした情報が探し出せる検索結果ほど、レレバンシー(relevancy、関連性)が高い「良い」検索エンジンといえる。

■「人が良い」と判断するページを機械で判断するためのアルゴリズム

以上が検索エンジンの基本的な仕組みであるが、最後に述べた「Web ページの並び替え、重み付け」それを担うのが SEO の世界でよく出てくる言葉、そして多くの SEO 担当者が踊らされる「アルゴリズム」だ。

アルゴリズムは確かにどの検索会社もブラックボックス化しており、その詳細はよく知られていない、得たいの知れないものだ。

ところで、本当にアルゴリズムは「得たいの知れないもの」なのだろうか。

第1に、アルゴリズムの仕組みを考えるのは宇宙のどこかの異星人ではなく、私たち人間だ。私たちが効率的に有益な情報を取り出すための仕組みとして考案するのがアルゴリズムであって、とりたてて秘密というわけではない。

つまり、効率的に情報を取り出すためにはどのようなロジックを組み立てるのが望ましいのか、その方向性を理解すればいいし、それは理解可能だ。つまり私がここで言いたいことは、情報検索(IR、information retrieval)の世界の理屈がわかれば、100%正確に Google や Yahoo!のアルゴリズムを理解していなくてもさほど問題がないということだ。

第2に、究極の目的として検索エンジンは、「人が見て良いと思う Web ページを機械で見つけ出す仕組み」を作りたいのであって、それを実現するのが数百もの評価要素で構成される複雑なアルゴリズムだ。人が見て良いと思われる情報、Web ページを機械で同様に判定するには何を見ればいいのかを考えて開発するのがアルゴリズムなので、本来 SEO で行うべきこと、そして最低要件として満たさなければいけないことは「人にとっても有益なコンテンツを作成し、公開すること」だ。

人の脳と同じように機械は処理ができないことがあるので、その分「機械に配慮した」文章を書く必要はないが、それに過度に媚びる必要も全くない。

第3に、アルゴリズムは数百もの評価要素によって構成されており、それらを総合的に点数化して適合性を判断する。従って、よく「タイトルにキーワードはいくつ入れるべきか」「本文は何百文字が望ましいのか」などといった個別論について1つ1つ頭を悩ませている SEO 担当者は少なくないが、その考え方に意味がない。

SEO は、検索エンジンに情報を適切に理解・伝達させようとするベストプラクティスの積み重ねによって行うものであり、自分たちはそのベストプラクティスのどれだけを実践すべきかを考えなければいけない。特定の行為をしただけでどれだけ[特定キーワードの順位に]影響があるのか、という評価をしても企業の投資対効果の判断基準としては不適切といえよう。

■SEO への投資対効果の最大化を忘れずに

さて、マーケットが非常にニッチ、専門的で検索されうるキーワードの絶対数やバリエーションが狭いのであればともかく、地域や車種、メーカーの掛け合わせキーワードにより膨大に潜在顧客にリーチしうる、ターゲットとすべきキーワードが存在するにもかかわらず、特定の検索キーワードでの SEO(というより検索結果1位)を目指して大量のリンクをかき集める手法を採用する企業もある。

もちろん、そのゴールが「検索結果で1位に表示しなければいけない」合理性があれば問題はないわけだが、現実には本来目指すべき集客や売上げ、成果の最大化というゴールを忘れて検索結果での順位遊びに落ち着いてしまっている企業が少なからずいるのではないだろうか。

たとえば、自社のビジネスに密接に関連するキーワード A〜Zの26があるとしよう。アルゴリズムが特に加点するリンクだけに特化して対策すれば、キーワードAの順位は上がる。しかし、適切にページ全体、サイト全体をまんべんなく最適化した場合、キーワードA〜Zの26すべてで最適化ができる。SEO への投資のリターンを最大化するためにはどちらが望ましいだろうか?

SEM だけでなく、行動ターゲティング広告やディスプレイ広告などほかのネット広告も展開しておりオンラインキャンペーン全体の ROI を考えるなら、自然検索からの流入間口の確保としてどちらの SEO が望ましいだろうか。雑誌や交通広告、ラジオなど様々なコンタクトポイントを持ちうるなら、どういった SEO が適切だろうか。SEO は企業と消費者とのコンタクトをつなぐものだ。

また、消費者の検索行動は1セッションあたりたった1回の検索しかしない「点」の行動ではない。1セッションあたり、様々な情報を見つけながら新たな興味・関心が生まれ、そして検索をするという「線」の行動だ。こうした検索行動の観点からも、自然検索で自社のサイトが上位に表示されるチャンスがたった1つのキーワードに限られていては、大きな機会損失にならないだろうか?

(執筆:株式会社アイレップ 取締役 SEM 総合研究所 所長 渡辺隆広)








関連記事
  • Danny Sullivan が語る検索エンジン進化の歴史と今後の展望 - SMX West 2008参加レポート(1)
  • 増える検索エンジン側からの SEO 情報提供
  • SEO 競合分析 3つの落とし穴
  • 自社に合った SEO フレームワークを考える
  • サーチブランディングとは何なのか


  • 関連テーマ
  • Yahoo!
  • SEO
  • Google


  • ★最新トップニュース
    国内 Suica ポイントと Yahoo! ポイントの相互交換サービススタート(Webビジネス 7月4日 17:00)
    東日本旅客鉄道株式会社(JR東日本)とヤフー(Yahoo! JAPAN)は2008年7月4日、「Suica ポイント」と「Yahoo! ポイント」を相互に交換できる「ポイント交換サービス」を2008年7月8日から開始すると発表した。
    国内 ソーテック、ソフトウェアダウンロード販売サービスを開始画像のある記事(E-コマース 7月4日 16:20)
    ソーテックは、2008年7月3日、ネットワーク認証型 DRM「Buddy」を提供するインターレックスと共同で「SOTEC SOFT DIRECT」を開設し、ソフトウェアのダウンロード販売サービス開始した。
    国内 「SoftBank SELECTION」ブランドの PC ソフト使用権をカード形式で店頭販売開始画像のある記事(Webビジネス 7月4日 15:40)
    ソフトバンクグループの BB ソフトサービスは、2008年7月3日、「SoftBank SELECTION」ブランドの PC 用ソフトウェアの使用権をカード形式で店舗販売することを発表した。
    国内 日立 GP と高電社、自動翻訳 ASP サービス販売で提携(Webマーケティング 7月4日 15:30)
    日立公共システムエンジニアリング株式会社 (日立 GP)と株式会社高電社は2008年7月4日、高電社が提供する自動翻訳サービス「J-SERVER プロフェッショナル My サイト翻訳(My サイト翻訳)」の販売提携を行うと発表した。
    国内 D-Link がコンパクトセキュリティスイッチ新製品発表(Webテクノロジー 7月4日 15:20)
    台湾ネットワーク機器販売企業 D-Link の日本法人ディーリンクジャパンは2008年7月4日、L2+コンパクトセキュリティギガビットスイッチ「DGS-3200シリーズ」の新製品「DGS-3200-16」を発表した。
    トピックス
    > オススメのIT系求人情報【毎週月曜日更新】
    footer_301.gif


    リサーチ
    > デイリーリサーチDLサイト
    > OnlineResearchPortal (リサーチデータバンク)
    > モバイルリサーチ with goo
    footer_301.gif
    キーワード
    > iPhone > モバイルノート
    > 08ソフトバンク夏モデル > ウィルコム
    > Youtube > インド新聞
    > テーマ一覧はこちら
    footer_301.gif
    セミナー情報
    > 第1回インターネットコムマーケティングセミナー「新規クライアントを効率的に獲得する Web マーケティング手法とは」(3月26日)多数のご参加ありがとうございました
    footer_301.gif
    デベロッパー
    > DevX
    > CodeGuru
    > developer.com
    footer_301.gif
    日本オラクル
    footer_301.gif
    j.i.c.ブログ
    ブログ一覧
    Graphic Design Forum 【Graphic Design Forum】
    スキャンについて - その二 (7月4日)
    データメーション 【データメーション】
    Firefox 3はブラウザ界の Danni Ashe(7月4日)
    ベンチャー専門家の目利きブログ「なぜこの企業は伸びるのか?」 【ベンチャー専門家の目利きブログ「なぜこの企業は伸びるのか?」】
    「インターネットの黎明期から培われた『歴史』を強みに、今後も残り続けていく製品を提供する」/有限会社赤黄緑青紫(7月4日)
    ジュピターメディア創設者がITを斬る 【ジュピターメディア創設者がITを斬る】
    素晴らしいエンターテインメント - Billy Joel(7月1日)
    デスマーチからの脱却 【デスマーチからの脱却】
    チャンスの神様(6月26日)
    Skypeブログ出張版 【Skypeブログ出張版】
    Skype 4.0 ベータ 1 for Windows登場(6月20日)
    footer_301.gif
    最新コラム一覧
    CodeGuru CodeGuru

    Visual C++ 2008 Feature Pack: MFCの強化(7月4日)
    最新ハイテク講座 最新ハイテク講座

    宮崎哲弥氏もお世話になってる「RSS」ってどんな技術?(7月4日)
    アイレップの SEO スタンダード アイレップの SEO スタンダード

    ユーザー動線の変化により対応が迫られるモバイル SEO(前編)(7月4日)
    百式のネットビジネス研究 百式のネットビジネス研究

    相手が読んだ瞬間に消えてしまうメッセージが送れる「Privnote」(7月4日)
    「IT の耳」 「IT の耳」

    【書評】IPTV 革命〜放送、ネット、モバイルのビジネスモデルが変わる〜(7月3日)
    週刊-サイト別アクセス状況データ 週刊-サイト別アクセス状況データ

    ビデオリサーチインタラクティブ調査(月間インターネットオーディエンスデータ)(7月3日)
    気になるトレンド用語 気になるトレンド用語

    ノキアのケータイ OS オープン化って何がすごいの?(7月2日)
    DevX DevX

    Script.aculo.usのコントロールでWebアプリケーションをもっと使いやすく(7月1日)
    エンジニア転職ノウハウ開発室 エンジニア転職ノウハウ開発室

    SEって「そもそも」ばっかで、融通きかないよね?(7月1日)
    アイレップの SEM フロンティア アイレップの SEM フロンティア

    Google のモバイル向けコンテンツターゲット広告を活用しよう(7月1日)
    footer_301.gif
    専門チャンネル
    > セキュリティチャネル > テレコムチャネル
    > サーチエンジンウォッチ
    footer_301.gif
    海外のインターネットコム アメリカ韓国ドイツトルコ
    関連企業のサイト:ストックフォト イラスト ネットストリート ホテル予約サイト タウン情報 出張 事業継承 シミュレーション トランクルーム 優待映画チケット 田舎暮らしガイド オリジナルデザインTシャツ ニタコエ
    Copyright 2008 Jupitermedia Corporation All Rights Reserved. http://www.internet.com/
    space.gif space.gif