XML-Dokumente

Regeln für
XML-Elemente

  • "Case-Sensitivity": XML unterscheidet zwischen Groß- und Kleinschreibung. Beispielsweise haben die Tags <name> und <Name> eine unterschiedliche Bedeutung.
  • Leerräume: Im Gegensatz zu HTML bleiben Leerräume, Zeilenumbrüche oder Tabulatoren erhalten.
  • Jedes Start-Tag muss ein End-Tag haben: Im Gegensatz zu HTML (z. B. <p> oder <br>) gibt es keine nicht geschlossenen Tags.
  • Tags dürfen sich nicht überlappen: bevor man "Parent-Elemente" schließt, müssen die "Child-Elemente" geschlossen werden.
  • Ein XML-Dokument kann nur ein "Root-Element" als oberstes Element haben. Ein Root-Element ist Pflicht.

<namen>
<name>Max</name>
<name>Walter</name>
</namen>

Hier ist <namen> ein künstlich eingeführtes Root-Element.

Attribute

Neben Tags und Elementen kann ein XML-Dokument auch noch Attribute enthalten. Attribute gehören immer zu einem Element.

<cd serial="123" id="ds">

Die Attributwerte müssen immer in Anführungszeichen stehen, und ein Attribut darf nicht leer bleiben. Attribute stellen Metadaten bereit. Man sollte Datenteile, welche die meisten Anwendungen nicht benötigen, in Attribute verpacken.

Kommentare

Kommentare gehören nicht zum eigentlichen XML-Dokument und werden gleich wie in HTML gekennzeichnet.

<!-- Das ist ein Kommentar

Kommentare dürfen nicht innerhalb von Tags stehen.

Character Data
(CDATA)

Besteht der Inhalt von Elementen aus Daten, so spricht man von Parsed Character Data (PCDATA). In XML gibt es einige reservierte Zeichen, die man nicht in die PCDATA integrieren kann: beispielsweise die Zeichen "<" oder "&". Die Verwendung dieser Zeichen würde einen Fehler verursachen. Man kann diese Zeichen entweder wie in HTML umgehen (z. B. "<" durch "&lt;") oder einen Character Data-Teil (CDATA) einbauen.

<kommentar><![CDATA[6 ist < 7 & 7 > 6]]></kommentar>

Der XML-Parser parst den Text innerhalb des CDATA-Teiles nicht. Dieser Teil wird einfach an die Anwendung durchgereicht.