space >>  Home>>Works>>ホームページの作り方>>HTMLの概要
1.HTMLの概要
1.1.HTMLとは?
 HTML(HyperText Markup Language)は、W3C (World Wide Web Consortium)が仕様制定している、Webサイトを記述するための言語である。 Webサイトのコンテンツである文章(文字情報)に、サイトの構造・色・文字の形式といった付加情報を、 『<』と『>』で囲まれたタグによって印つけ(マークアップ)をしていくことで、 それをWebサイトを閲覧するためのアプリケーション、すなわちブラウザMicrosoftの 『Internet Explorer』 や Netscapeの『Netscape Navigator』等)で読み込んだときに、 それがWebサイトとして表示されることになる。
 例えば、今ここに、ラタトゥーユのレシピが書かれたテキストファイルを用意した【文書1-1】。 Windowsの『メモ帳』やMacOSの『Simple text』といった基本的な文書作成ソフトなどで作られるこのようなテキストファイルは、 基本的には文章(文字情報)のみが記録されており、拡張子(ファイルの名前の語尾についている文字)は .txt となっている。 この文章にさまざまなタグを加え、拡張子を .txt から .html にしたものが、HTMLとなる。 ただし、HTMLファイルはブラウザ以外のソフト(『メモ帳』等)で読み込んだ場合は、テキストファイルと同じように、 文字とタグの羅列が表示されるだけとなる【文書1-2】。 HTMLファイルはブラウザで読み込んだときに初めて、複雑な構造をした色鮮やかなWebサイトとして表示されるのである【文書・完成】


1.2.タグを覚えればWebサイトが書ける
 では、ブラウザはどのようにHTMLファイルを読み込み、そして表示しているのであろうか。 先ほど述べたように、『 < 』 と『 > 』で囲まれたタグによるマークアップがポイントとなる。 ブラウザは、HTMLファイルに書かれた文字列を先頭から順に読み込んでいく作業を行っている。 それがタグに影響されていない普通の文章であった場合、その文字列はそのまま表示される。 一方、タグの先頭の合図である < がきたときは、末尾の合図である > がくるまでの部分をタグとみなし、 そこ書かれた内容は文字列としては表示せず、書かれたタグの文法にしたがってそれ以後の文章にその効果を反映させるのである。 なお、タグの効果は、効果の終了を示すタグまで続くものがほとんどで、開始のタグが<○○○>であった場合は、</○○○>が終了を示すタグとなる。 つまり、開始タグ<○○○>終了タグ</○○○>はセットになっていることが多く、この二つに囲まれた部分が○○○の影響をうけるのである。 また、任意の開始タグから終了タグまでのかたまりの事を要素(elemnent)という。
 例えば、文字に色をつけるためのタグ <FONT color="red">を使い、文章にマークアップすると以下のようになる。

見た目が悪くなってしまうのを防ぐため、 <FONT color="red">カボチャの煮込み時間を減らす</FONT>ためにこの前処理を行っておきます。

ブラウザで読み込むと…
見た目が悪くなってしまうのを防ぐため、 カボチャの煮込み時間を減らすためにこの前処理を行っておきます。

<FONT color="red">が開始タグ、</FONT>が終了タグで、 その間の『カボチャの煮込み時間を減らす』がFONT color="red"の効果を受けている内容となる。
 どんなに複雑なWebサイトであっても、このような簡単なタグによる要素の重なり合いによって構成されている。 つまり、W3Cで規定されたタグの種類とそれらの使い方を学ぶことが、 HTMLの学習、すなわちWebサイトの構築の学習と同義なのである。



※補足1:タグの中は半角英数字で記述するが、大文字でも小文字でもかまわないが小文字が推奨されている。

※補足2:要素は入れ子構造となっており、どちらかがどちらかを完全に含むようにする。例えば次のようになる。

見た目が悪くなってしまうのを<font size="-1">防ぐため、 <font color="red">カボチャの<font color="blue">煮込み時間</font>を減らす</font>ためにこの前処理を</font>行っておきます。

要素の包容関係はこのようになる
見た目が悪くなってしまうのを<font size="-1">防ぐため、 <font color="red">カボチャの <font color="blue">煮込み時間</font>を減らす</font>ためにこの前処理を</font>行っておきます。

ブラウザで読み込むと…
見た目が悪くなってしまうのを防ぐため、 カボチャの煮込み時間を減らすためにこの前処理を行っておきます。


※補足3:タグによってはタグ名の後に属性を指定することができる。 補足2の例でみれば、color="blue" や size="-1" が font の属性である。 特に color や size の部分を属性名、"blue" や "-1" の部分を属性値といい、 属性値はダブルクオーテーション( " )でかこったほうがよい。


1.3.HTMLを学ぶ意義
 情報化社会である今日、インターネットは我々の生活に欠かせないものになった。 中でもWebサイトの構築と閲覧は、早期から我々にとってなじみのあるもので、 今後も、インターネット技術の中核の一端を担うことは間違いない。 そのような状況の中、HTMLをはじめとするWebサイト構築に関する知識は、 Webサイト製作者のみならず、Webサイトを利用する全ての者が学ぶ価値のあるものだと思う。 HTMLは、Cやjavaといったプログラム言語と比べれば学習は至極簡単な言語であるが、 その学習によって得るものは大きい。
 まず、HTMLの知識があれば、大半のWebサイトは、その構造の把握が容易になるので、 効率よく閲覧したり、ダウンロードしたりできるようになる。
 また、javascriptも学ぶことで、セキュリティの向上にもつながる。 Webサイトの中には、ウィルスを送りつけてくるものや、 悪意あるプログラムを走らせてコンピュータに再起動が必要になるほどの負荷をかけてくるもの、 さらには、ハードディスクの内容を消去するものまで、危険なものが数多く存在する。 リンク先のサイトが危険そうであった場合、そのリンクをたどって移動する前に、 HTMLやjavascriptの知識を使ってその移動先のサイトの構造を調べれば、 それが危険かどうかを判別することが可能となるのである。


1.4.具体的に何を学べばよいのか
 タグを学ぶことがHTMLを学ぶことと同義であると先ほど述べたが、 タグはW3Cで標準化されているものを学べばよい。 使えるタグの種類はHTMLの標準化の歴史の中で変化しており、 2003年1月現在のバージョンは4.01である(http://www.w3.org/TR/html4/)。
 HTML4.01のDTD (Document Type Definitionの略。HTMLで使うことのできるタグの種類やそれらの使い方を定義したもの)は次の3種類ある。
  • Strict DTD(HTML 3.2において非推奨になった要素を削除したバージョン。フレームを使うことはできない。)
  • Transitional DTD(HTML 3.2との互換性を持ったバージョン(暫定的)。フレームを使うことはできない。)
  • Frameset DTD(フレーム関連の機能を使うことができるバージョン。)
 HTML4.xになって大きく変わった点は、『本来、HTML文書は論理構造情報だけをもつようにするべきで、 画面や印刷出力にどのように表現するかという文書の見栄えは、HTML ではなく、スタイルシートで定義しよう。』 という考えのもと、スタイルシート(CSS=Cascading Style Sheets が事実上の標準)を導入した点である。 HTMLは論理構造、スタイルシートは見栄え、というによう役割分担をすることで次のようなメリットがある。
  1. プログラム等による加工や情報抽出が容易になる。
  2. 構成要素の種類ごとにまとめて表現を指定できる。
  3. 複数の文書で1つのスタイルシートを共有できる。
  4. 1つの文書で複数のスタイルシートの使い分けが可能。
 HTMLとスタイルシートの使い分けを徹底した Strict DTD が、 W3Cの目指すところである。 スタイルシートへのブラウザの対応が遅れていたこともあり、 2003年1月現在ではTransitional DTDで記述するサイトが多いが、 これからHTMLを学習するならば、Strict DTDに従いスタイルシートも並行して勉強していったほうがよい。 よってここでは、Strict DTDに従ったWebサイトの記述の仕方を紹介していくことにする。
 ちなみに上で登場した<font>タグは、実は"過去のタグ"であり、現役の『Microsoft Internet Explorer』 や 『Netscape Navigator』 といったブラウザでも普通に読み込んでくれるものの、HTML4.xの仕様書では推奨されていない。 何故なら文字の装飾に関することは、見栄えの問題であり、HTMLではなくスタイルシートに依存すべきものだからだ。 よって、 <font size="-1"> は <span style="font-size : smaller">、 <font color="red">は<span style="color : red"> とする方がよいとされている。 スタイルシートの記述の仕方については、4章2節 以降で説明する。


1.5.HTMLの学習方法
_
 W3Cの仕様書を日本語翻訳したものを扱うサイトはいくつか存在する。 市販のタグ辞典やHTMLに関する参考書も参考になるが、わざわざお金をかけなくても、 オンラインの仕様書やHTMLやスタイルシートに関するWebサイトを参考にすればよい。
 ただし、これらはあくまで学習の助けとなる辞書のようなものであり、最もよいHTMLの学習方法は、 他人の作ったWebサイトを見て、実際自分で書いてみることであると思う。 タグの種類や使い方をただながめていても、それは数式を丸暗記するようなもので、それを使いこなせるようにはならない。 「このサイトのデザイン、いいな。」と思ったWebサイトがあったら、それのソースを見て (Windowsなら、ブラウザのウィンドウの上で右クリック>「ソースの表示」で、そのページのHTML文書=ソースを見ることができる)、 そのページがどのように書かれているのかを解析し、それを真似て書いてみるのがよい。
 ここでは、ラタトゥーユのレシピが書かれたこのページを完成イメージとし、 このページの作成を順に追いながら、Webサイトの記述の仕方を紹介していきたいと思う。

Copyright(c) 2003 Mr.HAMACCO All Rights Reserved. space