Webビジネス2004年5月12日 00:00
文字サイズ文字サイズ小文字サイズ中文字サイズ大

検索結果が文字化け!?

この記事のURLhttp://japan.internet.com/busnews/20040512/8.html
著者:アウンコンサルティング株式会社 執筆:片岡かおり /監修:信太明
国内internet.com発の記事
Web ページを見ていると、日本語がちゃんと表示されていない、つまり、日本語の文章であるべき部分が 意味不明の文字列で表示されていることがある。これを「文字化け」と呼ぶのだが、この現象、 あなたのサイトには起きていないだろうか。

文字化けの原因は、いくつか考えられる。まず、日本語の漢字コードには JIS 、シフト JIS (Shift_JIS)、EUC (EUC-JP) などの種類があり、通常はブラウザが自動的に漢字コードを判別するが、たまに判別を誤ってしまい文字化けを起こす。

また、日本語対応されていない FTP ソフトのテキストモード(ASCII モード)でファイルを転送する際に、文字化けが 発生することもある。その他、海外のサーバーを使用した場合に文字化けが発生したという例もある。

この文字化けという現象だが、ブラウザ上に正しく表示されないだけではなく、検索エンジン対策上にも 不利に働く。検索結果で文字化けしたタイトルやサマリーに出会うことはないだろうか? これは、文字化け したままインデックスされてしまった例である。これでは、対策を施しても全く意味がないと言える。

あなたのサイトが文字化けのままインデックスされていないかを確認するには、Google のツールバーにある 「サイト内検索」を利用するのが一番早いだろう。対象のサイトをブラウザに表示させる。次にドメイン部分 を検索窓に入れ「サイト内検索」をする。例えば当社運営サイトhttp://www.sem-ch.jp/の場合、サイトを開き、 「sem-ch.jp」を検索窓に入力。サイト内検索をクリック。すると約698件という結果が出てくる。 現在「sem-ch.jp」が Google にインデックスされているページ数と言える。この中に文字化けを起こして インデックスされている例があるのだ。場合によっては、文字化けされた英数字で検索結果に表示されることもある。

このような文字化けの対処法としては、文字コードの指定をお勧めする。HTML 文書は HTTP というプロトコルで 通信しているが、このプロトコルのヘッダに文字コードの記述を加えることにより、HTML 文書の漢字コードを 指定することができる。

【 Shift_JIS 】を指定する場合:
< head >〜< /head >の間に
< meta http-equiv="Content-type" content="text/html; charset=Shift_JIS" > を挿入する。

ただし、この文字コードを指定したからといって100%文字化けが回避できるわけではない。サーバー側の 設定も関係するし、ユーザーの閲覧環境にもよるからだ。

しかし、文字コードの指定をしておくことで、検索エンジンの文字コードに対する誤認識の確率が低くなり、 文字化けの可能性を減らすことができると言える。いま一度、サイトを見直してみてはいかがだろうか。

(執筆:コンサルティンググループ 片岡かおり、監修:信太明)


Copyright 2008 Jupitermedia Corporation All Rights Reserved.http://www.internet.com/