japan.internet.comThe Internet & IT Network
RSS
  • ニュース
  • コラム
  • リサーチ
  • ヘッドライン
  • 特集
  • ブログ
  • プレスリリース
  • 専門チャンネル
  • イベント
  • ランキング
  • ニュースメール
2008年9月9日
文字サイズ文字サイズ小文字サイズ中文字サイズ大
WebTutorial2001年7月4日 00:00

整形式の HTML -- 1

海外海外internet.com発の記事
  • このエントリーを含むはてなブックマーク
  • この記事をクリップ!
  • Buzzurlにブックマーク
  • Yahoo!ブックマークに登録
  • newsing it!
この記事は、Elliotte Rusty Harlold 氏の XML Bible(第2版)の出版元であるHungry Minds, Inc. から提供された。

整形式の HTML とは、整形式の XML に必要な制限をしっかり守っており、 しかもスタンダードな HTML タグのみを使用している HTML だ。 整形式の HTML は、 フロントページのような WYSIWYG ツールが作りがちなずさんで不揃いな HTML に比べて読みやすく、 Web ロボットや自動検索エンジンも簡単に理解できる。 頑丈で、変更を加えても壊れにくく、 レンダリングの際にブラウザやプラットフォームの違いで苛々させられることが少ない。 さらに、HTML文書で作業をする際、 XML 対応でないブラウザとも下位互換性を維持しながら、 XMLツールを使うことができる。

HTMLルール

実際のところ、非常にずさんな Web ページが多い。 タグが閉じてなかったり、要素が重複していたり、<符号がページに含まれていたり、 セミコロンが実体参照の終わりから省かれていたり。 このような問題のある Web ページは技術的には不正確であるが、 Webブラウザは受け入れてしまう。 しかし、間違いを修正したほうがページはきれいになり、表示が早くなり、 メンテナンスもしやすくなる。

Web ページで気を付けるべき、よくある間違いには下記のものがある。

    1. 開始タグに一致する終了タグがない。(未完了要素)

    2. 終了タグに一致する開始タグがない。(孤立タグ)

    3. 要素の重複

    4. 引用符のない属性

    5. <、>、& のようなアンエスケープ符号がある。

    6. ルート要素のない文書

    7. 終了タグが、一致する開始タグと異なるケースで使われている。

上記の順番は重要度には関係ないが、 詳細はタグによって異なる。 例えば、<STRONG>タグは、 閉じていなければそれに続く要素全てを強調してしまうが、 <LI>や<P>タグが閉じてなくても何の問題もない。

また、 既存の HTML ページに XML 文書を統合させる場合、 実際問題になってくるのは XML 文書で、 XML 文書にのみ関係するルールもある。 XMLに限定の制限には、下記のものがある。

    8. XML 宣言で文書を始める

    9. 空要素タグを a / > で終える

    10. 実体参照には

    &、<、>、&apos;、" のみ使用する。

これらを修正するのは難しくないが、 へまを起こすようなわなもいくつかある。 では、そんなわなを見つけてみよう。

全ての要素を閉じる

テキストであれ子要素であれ、 コンテンツのあるに要素は必ず開始タグと終了タグがなければならない。 HTML は、必ずしもそうでない場合もある。例えば、<P>、<DT>、<DD>、<LI>は、 単独で使われる場合が多い。 しかし、これはブラウザの種類によりけりで、 要素がどこで終了するのかを正しく推測してくれればの話だ。 ブラウザはいつも著者が考える通りに推測してくれる訳ではない。 よって、開始タグは必ず終了タグで閉じたほうが賢明である。

<P>をただパラグラフの切れ目のマークではなく容器としてとらえると、 HTML を作成する際に別の考え方が必要となる。 例えば、 オスカー ワイルドの『若人のための警句と哲学』 (Phrases and Philosophies for the Use of the Young)を下記の通り書き換えたとする。

不正とは善良なる人が悪者の奇怪な魅力を説明するために発明した神話である。 <P> 魂と肉体の違いがわかる人は、魂も肉体も持たない。 <P> 宗教は、それが真実だと証明されてしまったら死んでしまう。 科学は死んでしまった宗教が綴られたものである。 <P> 育ちのよいおぼっちゃまは自分達以外の者を否定する。 賢者は自分自身を否定する。 <P>

さあ、これらを下記のように書き換えなくてはならない。

<P> 不正とは善良なる人が悪者の奇怪な魅力を説明するために発明した神話である。 </P> <P> 魂と肉体の違いがわかる人は、魂も肉体も持たない。 </P> <P> 宗教は、それが真実だと証明されてしまったら死んでしまう。 科学は死んでしまった宗教が綴られたものである。 </P> <P> 育ちのよいおぼっちゃまは自分達以外の者を否定する。 賢者は自分自身を否定する。 </P>

<P> は、 パラグラフの終了を意味すると教えられたかもしれない。 今となっては、これをパラグラフの始まりと思いなおす必要がある。 この考え方をすると、有利なこともある。 例えば、パラグラフに簡単にフォーマット属性を指定できる。 一例として、
http://thomas.loc.gov/home/hres581.html
の下院581決議案の HTML タイトルを見てみよう。

<center> <p><h2> 議事日程表No. 272</h> <p><h1> 第105議会第2会期下院581決議案</h1> <p>[レポートNo. 106-795] <p><b>司法制度の定めるところにより当局を代表し、 米国大統領である William Jefferson Clinton への告訴に関し、 十分な証拠があるかどうかの審議に入ります。</b> </center>

つぎに、整形式の HTML を使った同じテキストがある。 center 要素に代わって align 属性が使われ、 <b>タグの代わりに CSS style 属性が使われている。

<h2 align="center"> 議事日程表No. 272</h2> <h1 align="center"> 第105議会第2会期下院581決議案</h1> <p align="center">[レポートNo. 106-795]</p> <p align="center" style="font-weight: bold"> 司法制度の定めるところにより当局を代表し、 米国大統領である William Jefferson Clinton への告訴に関し、 充分な証拠があるかどうかの審議に入ります。 </p>

続く



関連テーマ
最新トップニュース
データメーション
【データメーション】
在宅勤務者にやめて欲しいこと(10月10日)
ベンチャー専門家の目利きブログ「なぜこの企業は伸びるのか?」
【ベンチャー専門家の目利きブログ「なぜこの企業は伸びるのか?」】
「お客様に使われる商品開発は『1%の閃きと99%の努力』から!」/株式会社エス・アンド・ケイ(10月10日)
Graphic Design Forum
【Graphic Design Forum】
活気に満ちた誕生日をどうぞ (10月8日)
エンジニアの独り言
【エンジニアの独り言】
得体の知れない情報(?)との向き合い方(9月17日)
最新テクノロジーの意外な処方箋
【最新テクノロジーの意外な処方箋】
昆虫と退屈なことについて(9月16日)
台湾企業が席巻する電子製品製造
台湾企業が席巻する電子製品製造
蔓延する市場の不透明感、不況の今だからこそ考える生産アウトソーシング(10月10日)
IT マネジメント
IT マネジメント
「後戻りできない」 Windows 7(10月10日)
DevX
DevX
XQueryの制御構造の活用(10月10日)
最新ハイテク講座
最新ハイテク講座
ハイビジョン対応へ、どこまで進化するのか「レコーダー」(10月10日)
百式のネットビジネス研究
百式のネットビジネス研究
あなたの Blog にライブサーチを設置してくれる「Sikbox」(10月10日)
週刊-サイト別アクセス状況データ
週刊-サイト別アクセス状況データ
ビデオリサーチインタラクティブ調査(月間インターネットオーディエンスデータ)(10月9日)
検索エンジンマーケティング
検索エンジンマーケティング
SEO は外部と内部どっちの対策が効果的?(10月9日)
気になるトレンド用語
気になるトレンド用語
はてなブックマークが変わる!そもそもブラウザのお気に入りと何が違うの?(10月8日)
e-Japan 先端テクノロジー解説
e-Japan 先端テクノロジー解説
行政サービスのマルチチャネル化について(10月8日)
ウチのサイトを SEO
ウチのサイトを SEO
ちゃんと title つけていますか?(10月8日)
海外のインターネットコムアメリカ韓国ドイツトルコ
Copyright 2008 Jupitermedia Corporation All Rights Reserved.http://www.internet.com/