ある朝職場に来て、
Google からの自社のサイトへのトラフィックがなくなっているのに気づいたら、
トラフィックは、
ライバル会社のサイトにリダイレクトされている可能性がある。
驚いたことに、
このずうずうしい詐欺行為を止める方法はほとんどないかもしれない。
原因はあいまいな HTML コマンドにあり、
Yahoo や他の検索エンジン数社はこのコマンドを正しく解釈できるのに、
Google はうまく解釈していない。
少なくともこのトリックを知ることで、
上記のような状況が実際自分の身に起こったとき、
状況を理解する手助けになるだろう。
先々週、
Google では、
自分の書いたコンテンツよりそれをコピーしたページのほうが、
オリジナルページより上位にランキングされる仕組みであることを説明した。
そして
先週は、
オリジナルサイトが、
ランキングでコピーサイトから悪影響を受けないようにする方法を示した。
今回は検索エンジン問題についてのシリーズの締めくくりに、
Web サイトのトラフィックが完全にハイジャックされる、
という問題に目を向ける。
一言でコード302問題とは?
異なる2つの関連した HTML コードにより、別のサイトの Google
トラフィックをハイジャックできる。
・コード301は、恒久的な移動を表す。
コンテンツが別の場所に移動したとき、
Web マスターがこのコードをページに記載する。
つまりコード301は、
「ページ A は、現在ページ B にある」と、
Web マスターが検索エンジンに通知しているようなものだ。
このコードは、サイトが新しいドメイン名を取得した、
またはただディレクトリ構造名を変更したということを示すのに、
合法的に必要である。
通常検索エンジンは、
新しいページに古いページと同じ重要度を与える。
つまり企業は、
検索エンジンのリスティングでそれまでに獲得したランキングを失わずに、
コンテンツを好きに移動できるということを意味する。
・コード302は、一時的な移動を表す。(より正確には“found elsewhere(別の場所にある)”コードと呼ばれている)。
原則的にコード302は、
「ページ A は現在ページ B にあるが、
元に戻る予定なので、
ページ A へのリンクを継続し、
ページ B と同じ重要度を与えること」と言う意味だ。
このコードは合法的に使用することができる。
例えば、需要が高いコンテンツを一時的により太いサーバーに移動させて、
負荷を分散させることができる。
ページ A がページ B のトラフィックを盗むために、
コード302を使っている攻撃者のサイトであっても、
Google はときどき、
ページ B ではなくページ A をリンクしてしまうというところに問題がある。
また驚くべきことに Google は、
合法的なトラフィックを偽者に流すので、
訪問者が間違いにすぐに違いに気づかないと、偽者が利益を得ることができる。
一部の検索エンジンは、この問題を解決した。
これはまったく新しい問題ではないが、
Web マスターがコード302をより広く使うようになり、
最近深刻な問題になった。
Google 自身の“AdSense”リスティングですら、
無関係のサイトにハイジャックされた。
このサイトは、リンクが最新の日付で編集される手段として、
無邪気にもコード302を使用していた。
この問題に対する苦情は、
Search Engine Watch の編集長 Danny Sullivan 氏が、
検索エンジン関係者と公にこの問題を討論するために、
8月“Indexing Summit”を開催するまでになった。
Yahoo のソフトウェア開発ディレクタ Eric Baldeschweiler 氏によると、
Yahoo は、この問題をすでに何か月も前に解決したとのこと。
Yahoo は以下のような規則を使って問題を処理した。
・コード301の恒久的な移動はすべて正常である。
この場合、
Yahoo はページ B にリンクさせる。
コンテンツをサイト内の好きなところ、
またはまったく新しいドメインに、
問題なく安全に移動させることができる。
ただひとつの例外は、
Yahoo はまず初めにサイトのホームページの URL を表示し、
すぐ「ウェルカム」画面に移動するという点。
・コード302の同一ドメイン内への一時的な移動はすべて正常である。
この場合、 Yahoo はページ A にリンクさせる。
ページ A の検索エンジンランキングを失わずに、
一時的にトラフィックをページ A からページ B に移動させることができる。
・コード302のあるドメインから別のドメインへの移動は、
すべて恒久的な移動とみなす。
ページ A は何の利益も得ることはない。
Yahoo はページ B にリンクさせる。
これにより、いかなるサイトも、
無関係のサイトからトラフィックを盗むことができなくなる。
Sullivan 氏は、
「実際、Yahoo がこのような解決策にいたった」ことを確認している、と言う。
しかし、同様にこのサミットに参加していた「Google からの回答は、
「われわれはこの問題を解決したと思う」というものだったと、
同氏は付け加える。
Sullivan 氏は、
MSN Search もコード302問題の影響をある程度受けていると考えているが、
MSN はこのサミットに参加しなかった。
Google がある程度この問題の影響を受けている、と感じている人は他にもいる。
先週紹介したサービス Copyscape の開発者、 Gideon Greenspan 氏は、
「私が知る限り、 Google はまだ解決できていない」と言う。
Google 、技術サポートポータルを公開
自分の Web サイトのトラフィックが他者に流れていると思ったら、
Google が用意しているフォームに記入して、報告することができる。
Google のサーチクオリティエンジニア Matt Cutts 氏は、
自身の blog でこのフォームにリンクさせており、
フォームで報告された苦情は、
同氏が個人的に苦情を聞いたときと同等の調査を受ける、と言っている。
その通りかどうか確かめてみるべきだ。
現在影響を受けていようといまいと、
いずれ何らかの策を講じなければならなくなったときに備え、
リダイレクト問題に精通しておく必要がある。
(結局、そうなっても、猛烈に苦情を言うしかできないにしても)。
Sullivan 氏は、
自身の blog エントリで、
どのようにこの問題が Google と MSN Search に影響しているか、数例紹介している。
長年この問題を追跡しているインターネットコンサルタントの Claus Schmidt 氏は、
広範囲にわたって技術的説明を行っている。(これには、
Yahoo の解決策が、
コード301および302を定義しているオリジナルの RFC に適合している、
という注意書きが含まれている)。
結論
Yahoo の解決策は、極めて妥当で有効な策だと思う。
Google も他の検索エンジンも、
URL ハイジャックを分析するのに複雑な規則を試してみるより、
上記で示した合理的な301/302ポリシーを採用するべきだ。
この問題は存在するべきではないし、存在する必要もない。
朝職場に来るなり、
HTML トリックでサイトが突然大量のトラフィックを失ったのを知るなんて、
あんまりだ。