Title: Publication et Traitement avec XSL
1Publication et Traitement avec XSL
- 1. XPATH
- 2. XSLT
- 3. XSLFO
- 4. Traitement de documents
- 5. Conclusion
21. XPath l'adressage XML
- XPath
- Expressions de chemins dans un arbre XML
- Permet de sélectionner des nœuds par navigation
Document XML
?
XPath
3XPath
- XML Path Language
- recommandation W3C pour expressions de chemins
- acceptée le 16 novembre 1999
- version 2 en cours d'élaboration
- Expressions de chemins communes à
- XSL
- Xpointer (liens)
- XQuery (queries)
- Xpath permet
- de rechercher un élément dans un document
- d'adresser toute sous partie d'un document
XPath
4XPath - Parcours d'arbre
- XPath opère sur l'arbre d'un document
racine
ltlivre auteur "Hugo"gt lttitregtLes
chatimentslt/titregt ltchapitregt
ltsectiongtBuonaparte lt/sectiongt
ltsectiongtNeigelt/sectiongt lt/chapitregt
lt/livregt
livre
_at_auteur
chapitre
chapitre
titre
"Hugo"
section
section
Les chatiments
Neige
Bonaparte
XPath
5XPath - Expression de chemins
- Une expression de chemins spécifie une traversée
de l'arbre du document - depuis un nœud de départ
- vers un ensemble de nœuds cibles
- les cibles constituent la valeur du cheminement
- Un chemin peut être
- absolu
- commence à la racine
- /étape1//étapeN
- relatif
- commence à un nœud courant
- étape1//étapeN
XPath
6Syntaxe et sémantique
- Cheminement élémentaire
- directionsélecteur predicat
- Directions
- parent, ancestor, ancestor-or-self
- child, descendant, descendant-or-self
- preceding, preceding-sibling, following,
following-sibling - self, attribute, namespace
- Sélecteur
- nom de nœud sélectionné (élément ou _at_attribut)
- Prédicat
- Fonction(nœud) valeur
XPath
7XPath - Exemples
- Sections d'un chapitre
- /childlivre/childchapitre/childsection
- /livre/chapitre/section
- Texte du chapitre 1 section 2
- /descendantchapitreposition()
1/childsectionposition() 2/childtext() - //chapitre1/section2/text()
XPath
8XPath - Synthèse
XPath
92. XSLT la présentation
- Permet de transformer un document
- régulier ou irrégulier
- de XML à XML, XHTML est un cas particulier
- De XML à présentation (HTML, texte, rtf, pdf,
etc.) - Un document est un arbre
- Le processeur XSL parcourt l'arbre et applique
les règles de transformations vérifiées (à
condition vraie) aux nœuds sélectionnés - Un document est produit en sortie
XSLT
10Publications avec XSL
- Plusieurs formats de publication pour un contenu
- XSL permet la présentation sur des terminaux
variés
Format ( Postcript)
XML
Browser (XHTML, DHTML, HTML)
Document
XSL Processor
Format (XML) pour Word, Excel
Format (XML) application e.Commerce
format (WML)
XSLT
11Architectures
HTML
XML
Affichage
ASP ou JSP
S ERVEUR
Programme
XML
HTML
Processeur XSL
Affichage
Fichier
XML
XML
Processeur XSL
Base de données
XSLT
12Les feuilles de style
- Une feuille de style XSL
- est un document XML de racine ltxslstylesheetgt
- contient une liste de règles de transformation
ltxsltemplategt - Chaque règle (ltxsltemplategt) précise
- Une condition spécifiant le sous-arbre du
document dentrée auquel elle sapplique (match) - Une production spécifiant le résultat de
lapplication de la règle (contenu) - Il s'agit de règles de production classiques
- If ltcondtitiongt then ltproductiongt
- Codées en XML avec espace de nom xsl
XSLT
13Exemple de document
- lt?xml version"1.0" ?gt
- ltGuidegt
- ltRestaurant Categorie""gt
- ltNomgtLe Romantiquelt/Nomgt
- ltAdressegt
- ltVillegtCabourglt/Villegt
- ltDeptgtCalvadoslt/Deptgt
- lt/Adressegt
- lt/Restaurantgt
- ltRestaurant Categorie""gt
- ltNomgtLes TroisGroslt/Nomgt
- ltAdressegt
- ltVillegtRoannelt/Villegt
- ltDeptgtLoirelt/Deptgt
- lt/Adressegt
- lt/Restaurantgt
- lt/Guidegt
XSLT
14Exemple de feuille de style XSL
- lt?xml version"1.0" ?gt
- ltxslstylesheet xmlnsxsl"http//www.w3.org/xsl"
gt - ltxsltemplate match"/"gt
- lthtmlgtltheadgtltBgtESSAI XSLlt/Bgtlt/headgt
ltbodygtltxslapply-templates/gtlt/bodygtlt/htmlgt - lt/xsltemplategt
- ltxsltemplate match"Guide"gt
- ltH1gtBONJOUR LE GROUPE XMLlt/H1gt
- ltH2gtSUIVEZ LE GUIDElt/H2gt
- ltxslapply-templates /gt
- lt/xsltemplategt
- ltxsltemplate match"Restaurant"gt
- ltPgt ltIgtRestaurant lt/Igt
- ltxslvalue-of select"Nom"/gtlt/Pgt
- lt/xsltemplategt
- lt/xslstylesheetgt
XSLT
15Les règles de production
- Définition des règles par ltxsltemplate gt
- Attributs
- match condition de sélection des nœuds sur
lesquels la règle s'applique (XPath) - name nom de la règle, pour invocation explicite
(en conjonction avec ltcall-templategt) - mode permet d'appliquer à un même élément des
règles différentes en fonction du contexte - priority priorité, utilisé en cas de conflit
entre deux règles ayant la même condition - Exemples
- ltxsl template match"/"gt
- ltxsl template match"auteur" name"R1"
priority"1"gt
XSLT
16La génération du résultat
- Le contenu de l'élément ltxsltemplategt est la
production de la règle - Les éléments du namespace xsl sont des
instructions qui copient des données du document
source dans le résultat - Les autres éléments sont inclus tels quels dans
le résultat - Instructions pour
- Parcourir l'arbre du document source
- Copier le contenu du document source dans le
résultat - Parcours de l'arbre
- ltxslapply-templatesgt, ltxslfor-eachgt
- Copie du contenu du nœud sélectionné
- ltxslvalue-of select gt
XSLT
17Résumé des commandes
- ltxsltemplategt, définir une règle et son
contexte - ltxslapply-templates /gt, appliquer les
transformations aux enfants du nœud courant - ltxslvalue-of select /gt, extrait la valeur d'un
élément sélectionné à partir du nœud courant - ltxslfor-eachgt, définir un traitement itératif
- ltxslpigt, générer une processing instruction
- ltxslelementgt, générer un élément
- ltxslattributegt, générer un attribut
- ltxslifgt, définir un traitement conditionnel
XSLT
18Processeurs XSLT
- Processeurs XSLT conformes à la spécification
- Apache Group (www.apache.org) Xalan
- Oracle XDK (www.oracle.com) XML Parser/ XSL
Proc. - MSXML .NET
- James Clark (www.jclark.com) XT
- Saxon
- libXML, libXSLT (Unix C)
- Browser
- Microsoft MSXML et IE 5 ou plus
- Netscape supporte XSLT depuis la V6
- Firefox Mozilla
- Editeur et debugger
- Style Vision de Altova
- Oxygen de Synchro
- Stylus Studio de Data Direct
- CookTop et Tidy (gratuit)
XSLT
19Quelques éditeurs
XSLT
20IBM XSL Editor
Rendu
XML
XSLT
XSLT
21Bilan XSLT
- XSLT est un langage très puissant de
transformation d'un arbre XML en un autre - XSLT permet en particulier de publier des données
XML sur le Web par transformation en un document
HTML standard - XSLT est très utilisé
- Pour publier des contenus XML
- Pour transformer des formats (EAI, B2B)
XSLT
223. XSL-FO le formatage
- Permet les mises en pages sophistiquées
- Objets de mise en forme applicables aux résultats
avec XSLT - Distinction
- Formatage des pages
- Formatage des objets à l'intérieur des pages
- Statiques
- Dynamiques
XSL-FO
23Principes
- Peut s'appliquer aux résultats des feuilles XSLT
XSL-FO
24Organisation du document
- Un document FO est formé d'un élément foroot qui
comprend deux parties distinctes - une description des modèles de pages
- folayout-master-set
- une description du contenu
- fopage-sequence
- Le contenu comporte
- Des flux contenant les données mêmes du document
- Des éléments statiques dont le contenu se répète
sur les pages (en-têtes courants, no de page,
etc.)
XSL-FO
25Objets de formatage
- Les objets de formatage sont multiples
- ltfoblockgt
- utilisé pour les blocs de textes, paragraphes,
titres - ltfodisplay-rulegt
- ligne de séparation
- ltfoexternal-graphicgt
- zone rectangulaire contenant un graphisme (SVG)
- Ils possèdent de nombreuses propriétés
- Pour un block on peut définir
- la marge gauche et droite
- lespace avant et après le paragraphe
- la couleur du texte ...
XSL-FO
26Fonctionnalités
- Pages portrait ou paysage
- Pages recto-verso
- Page de tailles variées
- Marges multiples
- Colonnes multiples
- Entête et pieds de page
- Caractères unicode
- Formatage multi-langages
- Tables des matières générées
- Multiple directions d'écritures
- Numérotation des pages
- Graphiques et SVG
- Tables, avec entêtes,lignes et colonnes
fusionnables - Listes
- Zones flottantes
- Tris à l'édition
- Notes de bas de pages
XSL-FO
27XSL-FO hello World
- lt?xml version"1.0" encoding"iso-8859-1"?gt
- ltforoot xmlnsfo"http//www.w3.org/1999/XSL/Form
at"gt - ltfolayout-master-setgt
- ltfosimple-page-master master-name"my-page"
gt - ltforegion-body margin"2 cm"/gt
- lt/fosimple-page-mastergt
- lt/folayout-master-setgt
- ltfopage-sequence master-reference"my-page"gt
- ltfoflow flow-name"xsl-region-body"gt
- ltfoblockgtHello, world!lt/foblockgt
- lt/foflowgt
- lt/fopage-sequencegt
- lt/forootgt
- Element Root
- Permet de définir le namespace XSL-FO
- Layout master set
- Permet de déclarer une ou plusieurs page masters
(masque) et page sequence masters pour définir la
structure des pages (ici une de 2 cm de marges) - Page sequence
- Les pages sont groupées en séquences et
structurées selon la référence au masque. - Flow
- C'est le container du texte utilisateur dans le
document. Le nom du flot lit le texte à une zone
de la page définie dans le masque. - Block
- C'est le bloc de formatage qui inclut un
paragraphe de texte pouvant être produit pas
XSLT.
XSL-FO
28XSL-FO et XSLT Exemple
- Définition de propriétés pour la racine
- ltxsltemplate match/gt ltfo-display-sequence
font-styleitalic start-indent4pt
end-indent4pt font-size18pt
ltxslapply-templates/gt lt/fo-display-sequen
cegt lt/xsltemplate - La définition dune propriété locale est
prioritaire devant lhéritage
XSL-FO
29Les processeurs XSL-FO
- Apache Group FOP
- Formating Object Processor
- Génère du PDF http//www.apache.org
- JFOR (Open Source)
- Génère du RTF http//www.jfor.org
- Antenna House
- XSL Formatter http//www.antennahouse.com
- RenderX
- Génère du PDF http//www.renderx.com
- Altova
- StyleVision http//www.altova.com/products_
xsl.html - XML Mind FO Converter
- Génère du RTF http//www.xmlmind.com/foconverter
- Autres
- Arbortext, Adobe, Scriptura, XMLPDF, APOC, XSL-FO
to TeX
XSL-FO
30Bilan XSL
- XML format pour la production de publications
échangeables sur le web - production dune source unique en XML
- XSLT génération automatique de présentations
multiples - XSL-FO génération de présentations soignées
avec pages maîtres et blocs formatés. - XSL peut être vu comme le langage de
programmation de XML
XSL
314. XML le traitement par programme
XMLSchema(ou DTD)
DOM
Parser
SAX
Mal formé/Invalide
XSLFO
XSLT
Mapping
32L'interface DOM
- Standard W3C fait pour HTML et XML
- Structure d'objets pour représenter un document
- Résultat d'un "parser"
- Arbre d'objets reliés entre eux
- Interface objet pour naviguer dans un document
- Orientée objet
- Peut être utilisée en
- Java, C
- C, VB
- Python, PHP
DOM
33Principaux parseurs
Document XML
Xerces Apache (Java, C)
MSXML Microsoft
SDK Oracle Oracle
JAXP J2EE (Sun JDK) API générique J2EE
Parseur DOM
Arbre DOM
API DOM
Application
DOM
34Exemple d'arbre DOM
Racine du document
Document
NodeList
ltGuidegt
Element
NodeList
ltRestaurantgt
ltBargt
- ltGuidegt
- ltRestaurant id"R1"gtLe meilleur
restaurantlt/Restaurantgt - ltBar/gt
- lt/Guidegt
Element
Element
NamedNodeMap
Attr
Id"R1"
NodeList
Text
Le meilleur restaurant
DOM
35L'arbre DOM
- Navigation via un arbre générique de nœuds
- Node
- NodeList (Parent/Child)
- NamedNodeMap
- Tout nœud hérite de Node
Node
Document
ProcessingInstruction
DocumentType
Element
....
lt?xmlstylesheet ...gt
lt!DOCTYPE ...gt
ltRestaurant ....gt
Child
Text Le meilleur restaurant
DOM
36Quelques interfaces de base
- Document
- createElement (Nom_Element)
- créer un élément avec le nom spécifié en
paramètre. - createComment (commentaire)
- créer une ligne de commentaires dans le
document. - createAttribute (Nom_Attribut)
- créer un attribut avec le nom pris en paramètre.
- getElementsByTagName (nom_Tag)
- retourne tous les descendants des éléments
correspondants au Nom_Tag.
- Nœud
- insertBefore (Nouveau_Noeud, Noeud_Reference)
- insère un nouveau nœud fils avant le " nœud
référence" déjà existant. - replaceChild (Nouveau_Noeud, Ancien_Noeud)
- remplace le nœud "Ancien_Noeud" par le nœud
"Nouveau_Noeud". - removeChild (Nœud)
- supprime le nœud entré en paramètre de la liste
des nœuds. - appendChild (Nouveau_Noeud)
- Ajoute un nouveau nœud a la fin de la liste des
nœuds. - hasChildNodes()
- Retourne vrai si le nœud possède un enfant
DOM
37Autres interfaces
- Interfaces fondamentales
- DOMImplementation
- Document
- Comment
- DocumentFragment
- Element
- Attr(ibute)
- NamedNodeMap
- CharacterData
- Comment
- Text
- Interfaces étendues XML
- ProcessingInstruction
- DocumentType
- CDATASection
- Notation
- Entity
- EntityReference
DOM
38Exemple d'utilisation
- Public class ExempleDOM
- public static main (String argc) throws
IOException, DOMExcetion - XMLDocument xmlDoc new XmlDocument()
- // creation des nœuds
- ElementNode nom (ElementNode)
xmlDoc.createElement("nom") - ElementNode prenom (ElementNode)
xmlDoc.createElement("prenom") - ElementNode nomfam (ElementNode)
xmlDoc.createElement("nomfam") - // creation de l'arbre
- xmlDoc.appendChild(nom)
- nom.appenChild(prenom)
- prenom.appendChild(xmlDoc.createTextNode("Jean")
- nom.appenChild(nomfam)
- nomfam.appendChild(xmlDoc.createTextNode("Dupont")
- // positionnement d'un attribut
- nom.setAttribute("ville", "Paris")
- // sortie
- System.exit(0)
Document ltnom ville "Paris"gt ltprenomgt Jean
lt/prenomgt ltnomfagt Dupont lt/nomfagt lt/nomgt
DOM
39Bilan DOM
- Une interface objet standard
- Navigation dans l'arbre XML
- Traitements spécifiques
- Performance limitée
- Place mémoire importante
- Traitement à la fin de l'analyse
- DOM 2.0
- API indépendante de la structure mémoire
- DOM Level 3
- XPath
- Support direct de XPath
- Définition d'un XPath Evaluator
- Events
- Modèle d'événements
- Associés à un nœud
- Propagés dans l'arbre
- Style
- Accès aux styles
- Mapping complet
- Load and Save
- Stockage de larbre
DOM
40L'interface SAX
- SAX (Simple API for XML)
- modèle simplifié d'événements
- développé par un groupe indépendant.
- Types d'événement
- début et fin de document
- début et fin d'éléments
- attributs, texte, .
- Nombreux parseurs publics
- XP de James Clark, Aelfred, Saxon
- MSXML3 de Microsoft
- Xerces de Apache
- JAXP de SUN
SAX
41Principe de fonctionnement
Méthodes utilisateur
Evénement startDocument
Parser
Stream XML
Document XML
Evénement startElement
.
Evénement endDocument
Content Handler
SAX
42Les méthodes essentielles
- XMLReader
- setContentHandler
- setErrrorHandler
- parse
- ContentHandler
- startDocument
- endDocument
- startElement
- endElement
- characters
- ErrorHandler
- fatalError
- error
- warning
SAX
43Exemple SAX et DOM
startDocument () startElement (personne) startElem
ent (nom) characters (Cover) endElement
(nom) startElement (prenom) characters
(Harry) endElement (prenom) startElement
(adresse) startElement (rue) characters
(Stendhal) endElement (rue) startElement
(ville) characters (Paris) endElement
(ville) endElement (adresse) endElement
(personne) endDocument ()
ltpersonnegt ltnomgt Cover lt/nomgt ltprenomgt
Harry lt/prenomgt ltadressegt ltruegt
Stendhal lt/ruegt ltvillegt Paris
lt/villegt lt/adressegt lt/personnegt
SAX
44DOM versus SAX
- DOM utilise SAX pour la construction de larbre
dun document XML - SAX est plus léger que DOM
- Au-dessus de DOM, il est possible d implémenter
un method caller ...
SAX
45Integration API JAXP
- Java API for XML Parsing
- JAXP est une d'API standard J2EE permettant
d'effectuer des traitements XML qui englobe - SAX (SAX 2.0)
- DOM (DOM Level 2)
- la manipulation de transformations XSLT
- Objectif
- Fournir une couche dabstraction permettant
dutiliser nimporte quel analyseur SAX/DOM ou
processeur XSL - JAXP 1.3 est inclus dans le JDK de Sun
- Java WSDP 2.0, Java SE 5.0, disponible sur
Java.Net
46Le mapping objet (Data Binding- JAXB)
- Définition
- Mapping entre un document XML et un graphe
dobjets métier C ou Java
Interface générée à laide doutils de Data
Binding
Développements manuels
Objets C
Objets Java
Objets Java
Parsing Xerces C
Parsing XDK Java
Binding Java
XML
XML
XML
Mapping
47Principes
- Compilation du schéma en classes Java
- Traduction des documents en objets
- Possibilité de publier les objets en XML
compile
Schema
Classes
instance of
conforms
unmarshal
Objects
Documents
marshal
48Avantages
- Lactivité de développement "parsing" est réduite
- Gain en coût de développement des interfaces
- Les applications peuvent se concentrer sur le
fonctionnel - Les développeurs n'ont pas à se soucier du
mapping XML - Les Systèmes Techniques sont simplifiés
- Capitalisation sur linterface (utilisation,
évolution, ) - Gain en terme de fiabilité (fin de lutilisation
de parseurs variés, parfois écrits à la main) - Les performances de linterface sont optimisées
- Les outils de mapping sont intégrés aux serveurs
- J2EE JAXB
- .NET mapper
Mapping
495. Conclusion
- Un ensemble doutils pour traiter du XML
- Analyseurs validants
- Processeurs XSLT/XSLFO
- Intégrés aux serveurs dapplications
- J2EE JAXP
- .NET MSXML
- En évolution permanente