HTML
Die Hypertext Markup Language (HTML) ist ein Dokumentenformat zur Auszeichung von Hypertexten im World Wide Web und wurde 1989 von Tim Berners-Lee am CERN in Genf festgelegt. Sie basiert dabei auf der Metasprache SGML, die zur Definition von Auszeichnungssprachen verwendet wird. HTML ist also ein Auszeichnungssprache zur Beschreibung von Informationen in Hypertexten. Auch wenn sich ältere HTML-Versionen dafür verwenden lassen, geht es in HTML also nicht um die optische Gestaltung eines Textes. Vielmehr lassen sich einzelnen Textbereichen einzelne semantische Funktionen zuordnen (z. B. Überschrift), deren optische Gestaltung hierbei nebensächlich ist und mit CSS festgelegt werden kann. Beispielsweise gibt es ein HTML-Element zur Betonung von Textbereichen. Was ein Webbrowser daraus macht, ist Sache des Webbrowsers, nicht Sache von HTML. Ob ein mit diesem Element ausgezeichneter Textabschnitt vom Webbrowser durch Kursivschrift, Fettschrift oder eine auffällige Farbe realisiert wird, kann jedoch mit CSS neu festgelegt werden. Der nachfolgende Text soll diese Eigenschaften von HTML konkretisieren. Mittlerweile wurde die letzte Version des HTML-Standards ([4.01]) in der Meta-Sprache XML neu formuliert. Das daraus entstandene XHTML 1.0 genügt den im Vergleich zu SGML strengeren syntaktischen Regeln von XML, ist aber in seinen drei DTD-Varianten (Strict, Transitional und Frameset, siehe unten) semantisch mit der jeweils entsprechenden DTD-Variante von HTML 4.01 identisch. Aktuell liegt der XHTML-Standard in der Version 1.1 vor, der eine zusätzliche Modularisierung der Elemente einführt.
| Table of contents |
|
2 HTML-Struktur 3 DTD-Varianten 4 Falsche Interpretation von Webdokumenten 5 Sprachtyp 6 Weiterentwicklungen 7 HTML lernen 8 Weblinks |
Ein Textabsatz, der ein betontes Wort enthält.Überblick
Namensgebend sind die Hypertext-Elemente, die zum Verweis auf andere Textstellen oder auf ein anderes Dokument dienen. Zur Adressierung anderer Dokumente im Internet werden innerhalb des Dokumentes Hyperlinks verwendet. Dies ist die Grundlage für das WWW. Die Programme, die die Struktur und den logischen Aufbau des Dokuments interpretieren und als formatierte Webseiten (eventuell mit Interaktionselementen wie Links oder Formularen) darstellen, werden Webbrowser genannt.
Dem Text wird durch Auszeichnung (engl. mark-up) von Textteilen mit in der Regel paarweisen (öffnenden und schließenden) Tags eine Struktur und Logik verliehen. Die jeweils zusammengehörenden Tags bilden zusammen mit dem Inhalt zwischen den Tags ein Element. Diese Elemente lassen sich nach Regeln, die in einer Dokumenttypdefinition (DTD) angegeben sind, verschachteln:
Neben Elementen mit Start- und End-Tag gibt es auch leere Elemente, wie etwa Zeilenumbrüche oder Bilder:
Eine Textzeile,
\r\ndie hier fortgesetzt wird.
(Anmerkungen: zur Übersicht sind die Attribute umbrochen worden, dies ist nicht nötig, aber erlaubt. Ein Zeilenumbruch entspricht im HTML-Quellkode einem Leerzeichen.)
Dabei sind diese Tags keine Präsentations-Befehle (obwohl das in Zeiten von HTML 3.2 so war), die dem interpretierenden Webbrowser mitteilen, er müsse beispielsweise bis zum Auftreten des Endtags alles in Fettschrift setzen, sondern eine strukturgebende oder logische Auszeichnung, deren Repräsentation von der Umgebung abhängig ist. Obwohl HTML-Dokumente in der Regel auf Computerbildschirmen dargestellt werden, kann man sie auch auf anderen Medien ausgeben lassen, etwa auf Papier oder als Sprachausgabe.
Auf die Präsentation in verschiedenen Medien sollte mit HTML kein Einfluss genommen werden, dazu eignet sich CSS vorzüglich. Daher sollten Elemente und Attribute zur Präsentation, wie ...
In XHTML wurden einige Elemente geändert, damit sie der XML-Syntax entsprechen. Dies betrifft alle leeren Elemente, also solche, die keinen Text umschließen, wie Beispielsweise br oder hr. Diese werden nach den Regeln der Tag-Minimierung geschrieben als
Ein HTML-Dokument besteht aus drei Bereichen:
<html>
<nowiki><i>...</code>, ..., width, ... vermieden werden und stattdessen nur solche verwendet werden, die tatsächlich der Textauszeichnung dienen, wie etwa oder .... Die meisten der Präsentations-Elemente und -Attribute wurden in der HTML4-Spezifikation als missbilligt (engl. deprecated) markiert.
<H1>Dies ist eine Überschrift</H1>
beziehungsweise . Da einige ältere Browser jedoch Probleme mit dieser Darstellung haben, sollte zur besseren Abwärtskompatibilität ein zusätzliches Leerzeichen eingefügt werden, und das Element wie folgt geschrieben werden: . Außerdem sind alle Element-Bezeichner sowie Attribut-Bezeichner klein zu schreiben. Leere Attribute (z. B. nowrap) muss ein Wert zugewiesen werden (z. B. nowrap="nowrap"). Text muss immer durch Elementen beschrieben werden und darf nicht lose zwischen den body-Start- und -End-Tags stehen.HTML-Struktur
Allgemeine Struktur
Somit sieht die Grundstruktur einer Website wie folgt aus:





