DTD - Blocs de construction XML
Les principaux blocs de construction des documents XML et HTML sont les éléments.
Les blocs de construction des documents XML
D'un point de vue DTD, tous les documents XML sont constitués des blocs de construction suivants :
- Éléments
- Les attributs
- Entités
- PCDATA
- CDATA
Éléments
Les éléments sont les principaux blocs de construction des documents XML et HTML.
Des exemples d'éléments HTML sont "body" et "table". Des exemples d'éléments XML pourraient être "note" et "message". Les éléments peuvent contenir du texte, d'autres éléments ou être vides. Des exemples d'éléments HTML vides sont "hr", "br" et "img".
Exemples:
<body>some text</body>
<message>some text</message>
Les attributs
Les attributs fournissent des informations supplémentaires sur les éléments .
Les attributs sont toujours placés à l'intérieur de la balise d'ouverture d'un élément. Les attributs viennent toujours par paires nom/valeur. L'élément "img" suivant contient des informations supplémentaires sur un fichier source :
<img src="computer.gif" />
Le nom de l'élément est "img". Le nom de l'attribut est "src". La valeur de l'attribut est "computer.gif". Puisque l'élément lui-même est vide, il est fermé par un "/".
Entités
Certains caractères ont une signification particulière en XML, comme le signe inférieur à (<) qui définit le début d'une balise XML.
La plupart d'entre vous connaissent l'entité HTML : " ". Cette entité "no-breaking-space" est utilisée en HTML pour insérer un espace supplémentaire dans un document. Les entités sont développées lorsqu'un document est analysé par un analyseur XML.
Les entités suivantes sont prédéfinies en XML :
Entity References | Character |
---|---|
< | < |
> | > |
& | & |
" | " |
' | ' |
PCDATA
PCDATA signifie données de caractères analysées.
Considérez les données textuelles comme le texte situé entre la balise de début et la balise de fin d'un élément XML.
PCDATA est un texte qui SERA analysé par un analyseur . Le texte sera examiné par l'analyseur pour les entités et le balisage .
Les balises à l'intérieur du texte seront traitées comme des balises et les entités seront développées.
Cependant, les données de caractères analysées ne doivent pas contenir de caractères &, < ou > ; ceux-ci doivent être représentés par le & < et > entités, respectivement.
CDATA
CDATA signifie données de caractères.
CDATA est un texte qui ne sera PAS analysé par un analyseur . Les balises à l'intérieur du texte ne seront PAS traitées comme du balisage et les entités ne seront pas développées.