Title: Introduction lInternet
1Certificat de formation continue universitaire
en informatique médicale
Henning Müller Division d'Informatique
Médicale Université de Genève Octobre 2005
Internet XML et web sémantique
2Notre position dans le cours
- Quatre parties sur Internet
- Réseau et protocoles
- Histoire et organisation de lInternet
- XML, Web sémantique
- Enjeux de la commercialisation du Web
3Contenu
- XML
- Buts
- Histoire
- Structure
- Web sémantique
- Avantages, Problèmes
4XML
5XML - introduction
- XML - eXtensible Markup Language
- Version 1.0 10.2.1998
- Descendant de SGML (1986)
- Standard Generalized Markup Language
- Documentation sur le site du w3c
- http//www.w3.org/XML/
- Tutorial http//www.w3schools.com/xml/default.asp
- But principal
- Structurer l'information d'une manière standard
- Échange d'information
6Un petit exemple
lt?xml version"1.0"?gt lt!DOCTYPE
adressesgt ltadressesgt ltpersonne id"muellerh"gt
ltnomgtMüllerlt/nomgt ltprenomgtHenninglt/prenomgt
ltruegtRue Micheli-du Crestlt/ruegt ...
lt/personnegt lt/adressesgt
Auto documentation muellerhMüllerHenningRue
Micheli-du-Crest!
7Buts d'XML
- Définition d'un contexte de structuration de
données - Utilisable facilement sur Internet
- Compatible avec SGML
- Le plus lisible possible
- Minimum d'option, flexibilité maximale
- Développement de programmes simples
- Formats de données et de protocoles
- Concurrents (pas vraiment)
- Formats des fichier .ini sous Windows
- EDIFACT
- HL7 va vers XML en version 2.0
8Historique
- Descendant de SGML (ISO 8879)
- 150 pages de spécification
- Assez complexe, implémentation complète difficile
- Invention avant l'Internet (1970s)
- Autre application de SGML html
- XML version légère
- Début 1996
- 1.0 10.2.1998, second edition 2000
- XML 1.1 (recommandation) Namespaces
9Contexte XML
- XML Représentation de données
- XHTML HTML aux normes de XML
- DTD Document Type Definition (Structure)
- XSD XML Schema Definition (DTD en XML)
- XSL eXtensible Stylesheet Language (Traitement)
- DOM Document Object Model (Modèle de données)
- XML/QL Query Language
- Xpath Structuration du Parsing
- SMIL Synchronized Multimedia Integration
Language
10Syntaxe XML
- Similaire à HTML
- ltbalise attribut"valeur"gtContenult/balisegt
- Fermeture / balise
- Structuration hiérarchique (arbres)
- Un seul point de départ
- Élémentsous-arbre
- Élément vide ltbalise attribut"valeur"/gt
- attribut"valeur", Guillemets sont importants
- Commentaires
- lt!-- ceci est un commentaire jusqu'ici --gt
- Nom d'attributs en minuscules, noms unique
- Caractères interdits ou déconseillées ( ,-)
11Document XML
- Déclaration xml lt?xml ?gt
- version"1.0"
- Encodage encoding"UTF-8"
- standalone"yes"
- "Processing Instructions", traitement du XML
- Déclaration du type du document
- DTD/Schema
- Commentaires (Ignorés dans le processing)
- Contenu
12Arbre XML
Entête
adresses
personne
personne
nom
prénom
rue
nom
prénom
rue
13DTD - Document Type Definition
- Règles de structuration pour les documents XML
- Groupes peuvent se mettre d'accord sur un
structure pour échanger des données - Vérification des données
- Document bien formé syntaxe XML est OK
- Document valide structure est OK selon DTD
- Exemple
- LivreTitreContenu
- TitreTEXT
- Contenu Chapitre(s) Références
- Chapitre Section(s)
14DTD exemple
lt?xml version"1.0"?gt lt!DOCTYPE adresses
lt!ELEMENT adresses (personne)gt lt!ELEMENT
personne (nom,prenom,rue)gt lt!ATTLIST personne id
CDATA "noID"gt lt!ELEMENT nom (PCDATA)gt
lt!ELEMENT prenom (PCDATA)gt lt!ELEMENT rue
(PCDATA)gt gt ltadressesgt ltpersonne
id"muellerh"gt ltnomgtMüllerlt/nomgt
ltprenomgtHenninglt/prenomgt ltruegtRue
Micheli-du-Crestlt/ruegt ... lt/personnegt
lt/adressesgt
15XML et le Web
- XHTML (eXtensible Hypertext Markup Language)
- Reformulation de html 4.0 en XML
- Feuilles de style
- XSL/XSLT
- Générer des pages Webs en se basant sur des
documents XML et des feuilles de style - CSS - Cascading Style Sheets
- Définition de certains styles dans des pages pour
des éléments répétitifs
16Cascading Style Sheets (CSS)
- Redéfinition de l'affichage de balises connue
- Pages du SIM sont construites comme ça
- Économise de l'espace et facilite la maintenance
en cas de changements - Exemples
- H1font-weightboldfont-familyhelveticafont-sty
lenormal - Notion des classes
- ltp class"classique"gt Texte lt/pgt
- p.classique colorjaune
17XSL, XSLT
- Séparation du contenu et de l'affichage, XML n'a
pas d'info sur l'affichage - XSL - eXtensible Stylesheet Language
- Information sur l'affichage
- Serveur peuvent créer les pages avec XML et XSL
(Cocoon) - XSLT - XSL Transformations
- Langage de programmation pour transformer XML et
XSL dans un nouveau fichier en format XML - Utilisé pour la transformation en html, par
exemple
18DOM - Document Object Model
- Standard Application Programming Interface (API)
pour la structuration des documents - Création des interface au Web standard,
indépendant des browsers, systèmes d'opération - DOM for html, xml, css
- DOM crée un arbre d'un document
19Applications d'XML
- Structuration de données
- Stockage
- Simulation de bases de données
- Génération de html
- Structuration des sites Webs
- Pages actives
- Échange de données
- Format commun
- Outils d'analyse sont accessible
20Web sémantique
"The Semantic Web is an extension of the current
web in which information is given well-defined
meaning, better enabling computers and people to
work in cooperation." Tim Berners-Lee, James
Hendler, Ora Lassila, The Semantic Web,
Scientific American, May 2001
21Web sémantique
- Aujourd'hui
- gt1010 pages"black matter (estimations)
- Info lisible pour les machines
- Info n'est pas compréhensible pour des machines
- Beaucoup de redondances, peu organisé
- Difficile à analyser automatiquement
- Analogie avec des documents médicales
- Moteurs de recherche Google, Yahoo, Vivisimo,
- Plus moteurs spécialisés scholar.google.com ,
22Web sémantique (2)
- Demain
- Beaucoup plus de pages
- Information compréhensible pour les machines
- Annotation de linformation
- Facilités de partage (traduction)
- Facilité d'accès (aveugles)
- Information structurée et commentée
- Répertoire de connaissance
- Source de nouvelles connaissances (génération)
23Outils pour le Web sémantique
- Liées à l'annotation
- Représentation de la connaissance
- Ontologies (analogie domaine médical)
- Stockage, structuration de la connaissance
- RDF,
- Acquisition de la connaissance
- Annotea
24Ontologies
- Représentation de la connaissance (dun certain
domaine) - Terminologies
- Liens sémantiques
- Outils
- OIL (Ontology Interchange Language)
- DAML (DARPA Agent Markup Language)
- OWL (W3C) - OILDAML
25RDF - Resource Description Framework
- Utilise metadata pour décrire des données
- Description en format XML
- Non-ambiguë pour exprimer des concepts
sémantiques - Interopérabilité parmi différents partenaires
- Différents domaines peuvent décrire leurs besoins
- Ressource identifié par un URI
- Dublin Core Metadata Initiative a adopté RDV
- http//dublincore.org/
26Annotea
- Aide au développement des outils Web pour
l'annotations partagés - Commentaires, notes, explications
- Démonstration d'une infrastructure basée sur RDF
- Annotation stockée en externe
- Amaya est un browser/éditeur qui communique avec
un serveur d'annotation
27Future du Web sémantique
- Toujours en parallèle avec le Web normal
- Pas de remplacement
- Création d'un ensemble de pages compréhensibles
par les machines - Génération des connaissances
- Avec des information sémantiques
- Moteurs de recherches qui comprennent les pages?
28Conclusion
- Importance de XML ne se limite pas au Web
- Recherche d'information, gestion, affichage,
communication - Bases de données
-
- Grand place du Web sémantique dans le future!
- mais
29Liens
- http//www.w3.org/XML/
- http//xml.coverpages.org/sgml.html
- http//www.w3schools.com/dtd/default.asp
- http//www.w3.org/Style/CSS/
- http//www.oasis-open.org/cover/xsl.html
- http//www.w3.org/2001/sw/
- http//www.w3.org/RDF/
- http//www-ksl.stanford.edu/kst/what-is-an-ontolog
y.html - http//www.geneve.ch/reforme/fiche.asp?norefC4
- http//www.hon.ch/
- http//www.hin.ch/
30Abréviations
- API - Application Programming Interface
- CSS - Cascading Style Sheets
- DAML - DARPA Agent Markup Language
- DIM - Division d'Informatique Médicale
- DOM - Document Object Model
- DTD - Document Type Definition
- HIN - Health Info Net
- HON - Health on the Net
- OIL - Ontology Interchange Language
- OWL - OILDAML du W3C
- RDF - Resource Description Framework
31Abréviations (2)
- SGML - Standard Generalized Markup Language
- SVG - Scalable Vector Graphics
- XHTML - HTML en normes XML
- XML - eXtensible Markup Language
- XML/QL - XML Query Language
- XSD - XML schema definition
- XSL - eXtended Stylesheet Language
- XSLT - XSL Transformations