XML ist eine Metasprache für die Strukturierung von Informationen. Seit ihrer Veröffentlichung als W3C-Empfehlung im Jahr 1998 hat sich XML sowohl für die Speicherung als auch für den Austausch von Daten als Standard etabliert.

Entstehung

XML führt die Ideen der Standard Generalized Markup Language (SGML) fort. SGML wurde bereits 1986 als Metasprache zur Dokumentenbeschreibung [ISO8879] standardisiert. Aufgrund der hohen Komplexität konnte sich SGML jedoch nur begrenzt durchsetzen – abgesehen von HTML, der bekanntesten (und einfachsten) SGML-Anwendung. Zur Verringerung dieser Komplexität und zur Verkürzung der Definition des Standards wurde XML geschaffen. Dabei wurden die wesentlichen Ideen von SGML aufgegriffen und erschwerende Eigenschaften abgeschafft. Und während der offizielle SGML-Standard mehr als 500 Seiten umfasst, kommt die Definition des XML-Standards mit weniger als 30 Seiten aus.

XML-Anwendungen

Da XML (konträr zu seinem Cousin HTML) selbst keine Elemente vordefiniert, haben Entwickler die Möglichkeit, durch die Deklaration eigener Tags ganze Datenformate für spezifische Zwecke zu erzeugen. Auf diese Weise definierte Sprachen werden „XML-Anwendungen“ genannt. Beispiele solcher „XML-Anwendungen“, die sich seit ihrer Schöpfung zu weit verbreiteten Standards entwickelt haben, sind SVG (zur Beschreibung zweidimensionaler Vektorgrafiken), MathML (zur Abbildung mathematischer Formelsprache) oder DocBook (zum Markup technischer Dokumentationen).

Gültigkeit

Diese Flexibilität macht XML zu einem integralen Bestandteil der modernen Medienlandschaft. Doch die Freiheiten in der Definition neuer Markup-Sprachen sind keineswegs unbegrenzt. Besonders dann, wenn XML zum Datenaustausch verwendet werden soll, ist eine automatisierte Möglichkeit der Fehlerüberprüfung unabdingbar. Um die automatische Verarbeitung von XML-Anwendungen durch sogenannte XML-Parser zu ermöglichen, gibt es deshalb Kritierien, die in der Empfehlung des W3C festgeschrieben sind und die ein XML-Dokument erfüllen muss, um dieser Prüfung standzuhalten. Fachlich korrekt werden sie nach Bestehen dieser Prüfung als gültig bezeichnet.

Wohlgeformtheit

Zunächst muss ein XML-Dokument die Regeln der Wohlgeformtheit befolgen. Informationen können zwar mit selbst definierten Tags ausgezeichnet werden, dabei müssen jedoch gewisse Syntaxregeln befolgt werden, die das W3C festgeschrieben hat. Erfüllt ein Dokument alle diese Regeln, gilt es als well formed, zu deutsch wohlgeformt.

Validierbarkeit

Zusätzlich zu seiner Wohlgeformtheit muss ein gültiges XML-Dokument eine Grammatik referenzieren und die durch die Grammatik definierte Struktur einhalten. Diese sogenannte Validität bezeichnet die inhaltliche Korrektheit des Dokuments, und setzt eine korrekte Syntax schon voraus. Solche inhaltlichen Regeln werden in XML Schemas festgehalten und obliegen gänzlich dem Entwickler, der sie entwirft.

tl;dr:

XML ist eine Metasprache für die Strukturierung von Informationen. Mithilfe von XML können eigene Datenformate geschaffen werden. Gültige XML-Dokumente sind wohlgeformt und gegen ein Schema validierbar.

Kommentar hinterlassen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.