Title: Le langage XML : fonctionnalits et standards associs
1Le langage XML fonctionnalités et standards
associés
2La problèmatique
- Création de linformation 20 du PNB
- 90 de linformation sont des documents
- Traitement de texte et PAO traditionnels
- 30 du temps sur le formattage
- 30 du temps sur la recherche dinformations
- La technologie change tous les 18 mois
- US nombre de documents produits/an 92 Mds
3Les solutions
XML
1998
WWW
HTML
1992
1986
SGML
Internet
GM
1960
4XML Avantages
- Productivité
- Réutilisabilité
- Perrenité
- Integrité
- Partage
- Portabilité
5XML demain
- A partir du deuxième semestre de lan 2000
- le volume des données XML sera plus important
que celui des données HTML. - - Gartner Group
- 47 des entreprises utiliseront XML
- 47 des entreprises utiliseront Linux
- 90 des entreprises utiliseront Java
- - Java Web Panel survey, IBM 12/98
6Introduction à XML
- Premier exemple
- lt?xml version"1.0"
standalone"yes"?gt - ltIdentityCardgt
- ltFirstNamegtAntoinelt/FirstNamegt
- ltLastNamegtRizklt/LastNamegt
- ltCardNumbergt11437398lt/CardNumb
ergt - ltPhoto url"ar.gif"/gt
- lt/IdentityCardgt
-
7Documents bien formés
- A chaque balise ouvrante doit correspondre une
balise fermante - Balisage spécifique pour les éléments vides
- ltIMG SRC"picture.gif"/gt
- ltIMG SRC"picture.gif"gtlt/IMGgt
-
- Les balises doivent simbriquer
correctement - Une racine doit exister
- Un élément ne peut avoir des attributs vides
- ltDL COMPACTgt
- incorrecte
- ltDL COMPACT""gt
- correcte
8Documents valides
- Un document valide doit
- être bien formé
- ET
- se conformer à une grammaire (DTD)
-
9La DTD
lt!ELEMENT obs (loc, date, temp?, hygro?, nebulo?,
anemo?, pluvio?) gt lt!ATTLIST obs num ID REQUIRED
gt
- Document Type Definition
- Structure générique logique
- Grammaire de la structure du document
- Etablit les règles de structure de documents
- Définit les noms d'éléments
- Définit les relations entre éléments
- Déclare les attributs ainsi que leurs types
Document
parser validant
sortie
erreurs
DTD
10Les parsers
- Modèle événementiel (SAX)
- Callback appelé pour chaque événement
- début balise, attribut, fin document etc..
- Peut être efficace sur les gros documents
- Larbre nest jamais construit entièrement en
mémoire
11Les parsers (API DOM)
- Un modèle darbre est construit en mémoire
(arbres abstraits) - Lapplication accède par API à larbre pour le
manipuler - API DOM est normalisée (recommandation W3C)
12Limites dune DTD
- Un langage différent de celui des instances
- Limité à la structure darbre, différent du
modèle R - Pas de typage de contenu
- Pas dhéritage
- gt possibilité dutiliser des schémas XML-Schema
13Données/documents
dept
poste
labo
322
LABO 322 RIZK,Courtaud
lttelephone poste"322"gt ltdeptgtlabolt/deptgt ltperson
gtRizklt/persongt ltpersongtCourtaudlt/persongt lt/telepho
negt
compta
456
poste
nom
Rizk
322
Courtaud
322
Parigot
456
14Données ou documents ?
- ltchapitregt
- lttitregtceci est un fragment d'un livrelt/titregt
- ltnotegt
- ltpargt cette note contient deux paragraphes
- lt/pargt
- ltpargt un autre paragraphe
- lt/pargt
- lt/notegt
- lt/chapitregt
lttransactiongt lttime date"19980509"/gt ltamountgt123lt
/amountgt ltcurrency type"pounds"/gt ltfrom
id"X3543gtG.Dupontlt/fromgt ltto id"X7987gtJ.Smithlt/t
ogt lt/transactiongt
15Traitement XML/XSL
- Parsing et traitement applicatif
- import dans un SGBD
- Regénération export dun SGBD
- Fusion de données, génération darbre,
transformation - XSL
- Présentation
- CSS, XSL
16XSL
ltdategtdécembre, 1997lt/dategt
W3C XSL
\c6\f12\i décembre, 1997\par
ltP STYLE"font-styleitaliccolorgreen"gt décembre
, 1997lt/Pgt
ltfoblock font-style "italic" color"green"
xmlnsfo"http//www.w3.org/TR/WD-xsl/FO"gtdécembre
, 1997lt/foblockgt
...
ltxsltemplate match"date"gt ltfoblock
font-style"italic" color"green"gt
ltxslapply-templates/gt lt/foblockgt lt/xsltemplat
egt
17XML XSL
SGBDR
Terminal
XML
SGBDO
XML
Internet/Intranet
XSL
Terminal
HTML
- Portail/
- Serveur dintermédiation
Fichiers
Terminal
WAP
18XMLXSL
SGBD-R
labo
322
lttelephone poste"322"gt ltdeptgtlabolt/deptgt ltperson
gtRizklt/persongt ltpersongtIsraellt/persongt lt/telephone
gt
compta
456
Données XML Plus feuilles XSL
SGBD-O
Rizk
322
Israel
322
Parigot
456
19XML XSL generic architecture
Client-side XSL transform Client-side prog. -gt
DOM
SQL
R-DBMS
Query handling Server-side XSL transform
G X M L
Browser HTML/XML graphics rendering under CSS /
XSL fo control
R-DBMS
Net HTTP server(s)
Middle-tier server
XQL
20Ex. 2 ré-ingénierie de données
R-DBMS-1
DBMS-2(IR)
DBMS-3
DB2XML
DB2XML
DB2XML
XML
XML
XML
XML statique
Transformations (scripts)
Feuille XSLT
Processeur XSLT
XML données fusionnées
Script python
Impression catalogue
DB-RESULTAT
21(No Transcript)
22Les limites
- XML reste au niveau syntaxique
- Pas de typage
- Pas de sémantique
- Pas de relations/rôles entre concepts
- gt
- Les liens hypertextes XLL (XlinkXpath)
- Les métadonnées RDF spec et RDF schema
- Les schémas typés XML-Schema
- Les topic maps
23Liens simples
24Xpath
25Liens étendus
Document B
26Liens étendus out of line
Link elements
Document C
Document A
Document B
27Topic maps www.infoloom.com
28Lenjeu
- Définir une ontologie par domaine
- Organiser les schémas de navigation
- DTD concepts roles sémantique ontologie
- ontologie thesaurus RDF schema
- RDF schema gt RDF specifications gt métadonnées
- Augmenter le taux de précision
- Diminuer le taux de rappel
29Lévolution documentaire
RDF Ontologie, Thesaurus
Intermédiation
Structure sémantique
Production Publication
XML,XSL XQL,XLL, SMIL...
Structure syntaxique
Formats monomédia
ASCII, JPEG, MPEG...
30Létat actuel
- XML recommandation 10 fév 1998
- DOM DOM1 (1er oct 1998), DOM2 (Candidate 10 mai
00), DOM3.. - Xlink, Xpointer WD
- SVG WD V8
- SMIL WD V3
- XSLT Xpath recommandation 16 nov 1999
- XSL WD final
- MathML V1 (recommandation Avr 1998), V1.1
(Juil. 99), V2 (WD) - XML Schema , XMLQuery
- RDF Modelsyntax (recommandation fév
1999),schema spec (candidate Mars 2000) - XHTML
- Xforms WD 1
31Autres applications (1)
- Channel Definition Format, CDF (Based on XML)
- Web Collections using XML
- Meta Content Framework Using XML (MCF)
- XML-Data
- ANZLIC - Metadata
- XML Metadata Interchange Format (XMI) - OMG
- Educom Instructional Management Systems Project
(IMS) - Structured Graph Format (SGF)
- Legal XML Working Group
- Web Standards Project (WSP)
- Open Software Description Format (OSD)
- XLF (Extensible Log Format) Initiative
- WAP Wireless Markup Language Specification
- HTTP Distribution and Replication Protocol (DRP)
- Chemical Markup Language
- Bioinformatic Sequence Markup Language (BSML)
- Virtual Hyperglossary (VHG)
- Weather Observation Definition Format (OMF)
- vCard Electronic Business Card
- Open Financial Exchange
- Open Trading Protocol (OTP)
- Signed Document Markup Language (SDML)
- Bank Internet Payment System (BIPS)
- OpenMLS - Real Estate DTD Design
- Customer Support Consortium
- XML for the Automotive Industry - SAE J2008
- X-ACT - XML Active Content Technologies Council
- OpenTag Markup
- CDIF XML-Based Transfer Format
- Precision Graphics Markup Language (PGML)
- Vector Markup Language (VML)
- WebBroker Distributed Object Communication on
the Web - Web Interface Definition Language (WIDL)
- XML/EDI - Electronic Data Interchange
- XML/EDI Repository Working Group
- DISA, ANSI ASC X12/XML
- Information and Content Exchange (ICE)
- CommerceNet Industry Initiative
32Autres application (2)
- LACITO Projet Archivage de données linguistiques
- Astronomical Markup Language
- GedML GEDCOM Genealogical Data in XML
- Newspaper Association of America (NAA) -
Classified Ads Format - Notes Flat File Format (NFF)
- Java Help API
- Cold Fusion Markup Language (CFML)
- Document Content Description for XML (DCD)
- XSchema
- WEBDAV
- Tutorial Markup Language (TML)
- Java Speech Markup Language (JSML)
- XML and VRML (Virtual Reality Modeling Language)
- XML for Workflow Management NIST
- SWAP - Simple Workflow Access Protocol
- Theological Markup Language (ThML)
- XML-F ('XML for FAX')
- Extensible Forms Description Language (XFDL)
- Broadcast Hypertext Markup Language (BHTML)
- Open Settlement Protocol (OSP) - ETSI/TIPHON
- WDDX - Web Distributed Data Exchange
- Common Business Library (CBL)
- Open Applications Group - OAGIS 6
- Schema for Object-oriented XML (SOX)
- VoxML Markup Language
- Telecommunications Interchange Markup (TIM,
TCIF/IPI) - Encoded Archival Description (EAD)
- UML eXchange Format (UXF)
- Translation Memory eXchange (TMX)
- Scripting News in XML
- InterX.org Initiative
- NuDoc Technology
- Coins Tightly Coupled JavaBeans and XML Elements
- DMTF Common Information Model (CIM)
- Process Interchange Format XML (PIF-XML)
- Ontology and Conceptual Knowledge Markup Languages
33Pour aller plus loin ..
- www.w3c.org
- www.oasis-open.org/cover