XML - Syntaxe

Dans ce chapitre, nous aborderons les règles de syntaxe simples pour écrire un document XML. Voici un document XML complet -

<?xml version = "1.0"?>
<contact-info>
   <name>Tanmay Patil</name>
   <company>TutorialsPoint</company>
   <phone>(011) 123-4567</phone>
</contact-info>

Vous pouvez remarquer qu'il existe deux types d'informations dans l'exemple ci-dessus -

  • Balisage, comme <contact-info>

  • Le texte ou les données de caractères, Tutorials Point et (040) 123-4567 .

Le diagramme suivant décrit les règles de syntaxe pour écrire différents types de balisage et de texte dans un document XML.

Voyons chaque composant du diagramme ci-dessus en détail.

Déclaration XML

Le document XML peut éventuellement avoir une déclaration XML. Il s'écrit comme suit -

<?xml version = "1.0" encoding = "UTF-8"?>

version est la version XML et le codage spécifie le codage de caractères utilisé dans le document.

Règles de syntaxe pour la déclaration XML

  • La déclaration XML est sensible à la casse et doit commencer par "<?xml>" où "xml"est écrit en minuscules.

  • Si le document contient une déclaration XML, il doit être strictement la première déclaration du document XML.

  • La déclaration XML doit être strictement la première instruction du document XML.

  • Un protocole HTTP peut remplacer la valeur de l' encodage que vous mettez dans la déclaration XML.

Balises et éléments

Un fichier XML est structuré par plusieurs éléments XML, également appelés nœuds XML ou balises XML. Les noms des éléments XML sont entre crochets triangulaires <> comme indiqué ci-dessous -

<element>

Règles de syntaxe pour les balises et les éléments

Element Syntax - Chaque élément XML doit être fermé avec les éléments de début ou de fin comme indiqué ci-dessous -

<element>....</element>

ou dans des cas simples, juste de cette façon -

<element/>

Nesting of Elements- Un élément XML peut contenir plusieurs éléments XML comme enfants, mais les éléments enfants ne doivent pas se chevaucher. c'est-à-dire qu'une balise de fin d'un élément doit avoir le même nom que celui de la balise de début sans correspondance la plus récente.

L'exemple suivant montre des balises imbriquées incorrectes -

<?xml version = "1.0"?>
<contact-info>
<company>TutorialsPoint
</contact-info>
</company>

L'exemple suivant montre les balises imbriquées correctes -

<?xml version = "1.0"?>
<contact-info>
   <company>TutorialsPoint</company>
<contact-info>

Root Element- Un document XML ne peut avoir qu'un seul élément racine. Par exemple, ce qui suit n'est pas un document XML correct, car les deuxx et y les éléments se produisent au niveau supérieur sans élément racine -

<x>...</x>
<y>...</y>

L'exemple suivant montre un document XML correctement formé -

<root>
   <x>...</x>
   <y>...</y>
</root>

Case Sensitivity- Les noms des éléments XML sont sensibles à la casse. Cela signifie que le nom des éléments de début et de fin doit être exactement dans le même cas.

Par exemple, <contact-info> est différent de <Contact-Info>

Attributs XML

Un attributespécifie une propriété unique pour l'élément, en utilisant une paire nom / valeur. Un élément XML peut avoir un ou plusieurs attributs. Par exemple -

<a href = "http://www.tutorialspoint.com/">Tutorialspoint!</a>

Ici href est le nom de l'attribut et http://www.tutorialspoint.com/ est la valeur d'attribut.

Règles de syntaxe pour les attributs XML

  • Les noms d'attributs en XML (contrairement au HTML) sont sensibles à la casse. Autrement dit, HREF et href sont considérés comme deux attributs XML différents.

  • Le même attribut ne peut pas avoir deux valeurs dans une syntaxe. L'exemple suivant montre une syntaxe incorrecte car l'attribut b est spécifié deux fois

    -
<a b = "x" c = "y" b = "z">....</a>
  • Les noms d'attribut sont définis sans guillemets, tandis que les valeurs d'attribut doivent toujours apparaître entre guillemets. L'exemple suivant montre une syntaxe XML incorrecte

    -
<a b = x>....</a>

Dans la syntaxe ci-dessus, la valeur d'attribut n'est pas définie entre guillemets.

Références XML

Les références vous permettent généralement d'ajouter ou d'inclure du texte ou du balisage supplémentaire dans un document XML. Les références commencent toujours par le symbole"&" qui est un caractère réservé et se termine par le symbole ";". XML a deux types de références -

  • Entity References- Une référence d'entité contient un nom entre les délimiteurs de début et de fin. Par exemple&amp;amp est le nom . Le nom fait référence à une chaîne prédéfinie de texte et / ou de balisage.

  • Character References - Ils contiennent des références, telles que &#65;, contient un signe dièse («#») suivi d'un nombre. Le nombre fait toujours référence au code Unicode d'un caractère. Dans ce cas, 65 fait référence à l'alphabet "A".

Texte XML

Les noms des éléments XML et des attributs XML sont sensibles à la casse, ce qui signifie que le nom des éléments de début et de fin doit être écrit dans la même casse. Pour éviter les problèmes de codage de caractères, tous les fichiers XML doivent être enregistrés en tant que fichiers Unicode UTF-8 ou UTF-16.

Les espaces blancs tels que les espaces, les tabulations et les sauts de ligne entre les éléments XML et entre les attributs XML seront ignorés.

Certains caractères sont réservés par la syntaxe XML elle-même. Par conséquent, ils ne peuvent pas être utilisés directement. Pour les utiliser, certaines entités de remplacement sont utilisées, répertoriées ci-dessous -

Caractère non autorisé Entité de remplacement Description du personnage
< & lt; moins que
> & gt; plus grand que
& & amp; esperluette
' & apos; apostrophe
" & quot; Guillemet