Title: Prsentation PowerPoint
1(3)
Frédérique PEGUIRON Frederique.Peguiron_at_scd.uhp-na
ncy.fr
2Présentation
Acteurs
Modèles
Développement
3Modèles
4Différents modèles
Protocole OAI-PMH
Fonctionnement
5Différents modèles
-
- Réformes enseignement, université
- Technologies normes et des standards
- Économie coût de la documentation
- Contexte économique et technologique permet de se
distancier du - modèle catalogue pour lémergence didées
autour de - système dinformation communicationnel où nous
glissons - dune science faite à une science en train de
se faire et de - se dire
modèles alternatifs
modèles palliatifs
5
5
6Principes organisationnels
- Le protocole définit le langage par lequel
communiquent - le fournisseur de données entrepôt et
- le fournisseur de services agrégateur données
collectées par moissonneur - Pour alimenter lagrégateur, le moissonneur
visite plusieurs entrepôts, - pour extraire les enregistrements des items
qui lintéressent. - Après la collecte, le moissonneur dépose les
données dans une base que - le fournisseur de services rend accessible à
ses clients. - Linterrogation de cette base est directe et ne
sollicite pas les entrepôts - dorigine.
- Lutilisateur final interroge uniquement le
réservoir de notices moissonnées. - Ces notices proposent un lien hypertexte vers le
document primaire - accessible sur le serveur du fournisseur de
données.
7(No Transcript)
8Modèle OAIS
- LOAIS Open Archival Information System
constitue un - modèle de référence pour un
système - ouvert darchivage dinformation
- Cadre conceptuel et terminologique
- implantation de système de gestion de ressources
numériques - la préservation
- laccessibilité
long terme
Cadre d'apparition risques de perte de données
liés à lobsolescence des technologies (codage
ou supports). Issu du monde des archives du
secteur de laéronautique Devient en 2002 une
norme (ISO 14721 2002) Préservation de
ressources électroniques pour leur mise à
disposition future avec toutes les données
permettant den assurer la lecture (techniques,
juridiques...)
9Deux modèles complémentaires
Modèle OAIS
Modèle fonctionnel Découpage en cinq grandes
fonctions
- Production,
- Versement,
- Stockage,
- Préservation,
- Utilisation.
- couche administration
- accès
- Modèle dinformation
- Manipulation d'objets dinformation
- paquet dinformation darchivage archivage
information package ou AIP - objet contenu informationnel dont
intelligibilité est préservée, quelque - soit lenvironnement technique
PIA
PIA paquets dinformation darchives 2 classes
dobjets IC information contenue PDI
information complémentaire à la pérennisation
IC
PDI
1999 PIN pérennisation des informations numériques
10Modèle METS
- Modèle METS (Meta data Encodage and Transmission
Standard) - réalisé à linitiative de la Digital Librairie
Fédération (DLF) - gt implémentation particulière du modèle de
référence OAIS - gt permet les échanges dobjets numériques
entre bibliothèques. - METS est un schéma XML
description de la structure hiérarchique des
objets numériques
Un document METS est composé
- noms des fichiers,
- localisations des fichiers,
- métas données
- de structure,
- administratives,
- descriptives.
ressource numérique
Dublin Core 7 sections header, descriptive
metadata, administrative metadata, file group,
structure map, structural links, behavior.
Maintenance La bibliothèque du Congrès
11Modèle OAI
LUPOVICI, 1999 la modélisation permet de faire
évoluer la vision des ressources numériques,
elles-mêmes étant un tissu dobjets
dinformation liés entre eux.
- De nombreux modèles alternatifs se sont
développés restant indépendants - les uns des autres et ne permettant pas une
synergie entre les collections. - Lors de la convention à Santa Fé en 1999, des
professionnels ont décidé de - développer un cadre général pour la
fédération de contenus sur le web. - Deux solutions ont été présentées interroger
simultanément des bases - hétérogènes et réparties selon le protocole
Z39.50 ou collecter - massivement les métas données dans un ou
plusieurs réservoirs centraux. - Lintérêt pour cette dernière formule sest
développé dans les musées et - bibliothèques, et a abouti en septembre 2000
à une formalisation de - lOpen Archive Initiative.
12Protocole OAI-PMH
- Protocole de collecte et de mise à disposition de
métas données - Version 2 juin 2002
- Protocol for metadata harvesting
- Protocole de collecte de métas données de
linitiative Archives ouvertes OAIP
Objectif
Contenu dune archive
- découvrir,
- présenter,
- analyser
quel que soit son contenu, pour la mettre
largement à disposition.
LOAI-PMH facilite la description, le partage et
la diffusion des métas données darticles
scientifiques disponibles en accès ouvert sur
Internet, notamment dans des répertoires de
pré-publications.
13Principe fonctionnel
- Modèle fonctionnel autour de 2 catégories
dacteurs - les fournisseurs de données ou de métas données
exemple des réservoirs - en chimie http//www.chemweb.com,
- en sciences de la vie http//www.pubmedcentral.nih
.gov, - en France le CCSD http//www.ccsd.cnrs.fr.
- les fournisseurs de services localisent les
fournisseurs de données et - collectent leurs métas données de manière
automatique et incrémentale. - Ajout dinformations à valeur ajoutée sous
la forme de services - recherche,
- Personnalisation,
- Alerte.
Ce modèle poursuit son développement avec des
extensions techniques et fonctionnelles, comme
les projets dincorporation de la gestion de la
certification ou des droits.
Centre pour la Communication Scientifique
Directe du CNRS
14Principes conceptuels
- Le protocole OAI sappuie sur quelques concepts
documentaires simples - trois niveaux
- la ressource document-objet décrit
- réel un livre
- virtuel une image numérique, un texte
électronique - litem fiche ou notice informatique décrivant
lobjet - une notice bibliographique format UNIMARC
- génération des métas données échangeables le
protocole OAI - un identifiant unique litem
- lenregistrement record
- ensemble de métas données extraites dun item en
XML - objet déchange entre lentrepôt et le
moissonneur
15Fonctionnement
16Moissonneur
Programme lancé par le fournisseur de services
pour la collecte de métadonnées auprès d'un ou
plusieurs entrepôts OAI. Les échanges se font par
l'envoie de requêtes XML via les protocoles Http
et Url.
6 requêtes du moissonneur
- GetRecord demande d'un enregistrement précis
(item), - Identify demande d'informations sur l'entrepôt
pour vérifier s'il s'agit bien d'un entrepôt OAI, - ListIdentifiers demande la liste des
identifiants contenus dans l'entrepôt ainsi que
leurs dates de dernière modification, - ListMetadataFormat demande la liste des formats
de données disponibles dans l'entrepôt, - ListRecords collecte les items contenus dans
l'entrepôt (tout ou partie), - ListSets demande la liste des ensembles formés
par l'entrepôt.
Exemple À la requête ListMetadataformats dun
moissonneur, lentrepôt doit pouvoir décliner la
liste des formats disponibles avec ladresse à
laquelle est accessible la DTD ou le Schéma XML.
17Foulonneau 2003 Sévigny, 2002 Concrètement,
un entrepôt OAI (base de métadonnées), permet à
un fournisseur de données de rendre disponible,
dans différents formats, les métadonnées des
documents disponibles dans une base. Un
fournisseur de services pourra alors, via un
moissonneur, collecter les métadonnées désirées
sur un entrepôt OAI donné.
Le protocole OAI-PMH ne gère donc que le
transfert des données, ce n'est pas un protocole
de méta-recherche.
Exemple Lusage de lOAI-PMH dans le portail
SUDOC Le moissonneur nourrit une base XML. Le
portail SUDOC de lABES comporte une base XML
alimentée soit par saisie directe, soit par
moisson OAI, soit par des opérations de
chargement en série.
18XML
- Dans le contexte des archives ouvertes, le XML
est utilisé pour - implémenter les métadonnées,
- l'échange de celles-ci.
- Echange de métadonnées autour de deux niveaux
- syntaxique qui correspond à la représentation
concrète des choses (structure XML quelconque) - sémantique qui renvoie au système descriptif
utilisé (au minimum le Dublin Core non qualifié). - Résumons ces aspects techniques le protocole
OAI-PMH fait appel - à trois normes et standards.
- Dublin Core non qualifié qui permet de décrire
les ressources, - XML, langage structuré qui permet d'implémenter
et échanger les métadonnées, - protocole Http qui transporte les balises XML.
19- Modèles éditoriaux
- Atmospheric Chemistry and Physics
http//www.copernicus.org/EGU/acp/acpd/recent_pape
rs.html - Biomed Central http//www.biomedcentral.com
- Blackwell Modèle Oline Open
http//www.blackwellpublishing.com/static/onlineop
en.asp - Nature Expérience 2006 en cours
http//blogs.nature.com/nature/peerreview/trial/ - Oxford University Press - Modèle Oxford Open
http//www.oxfordjournals.org/oxfordopen/ - Public Library of Science PloS
http//www.plos.org/index.php - Springer Modèle Open Choice
http//www.springer.com/dal/home/openchoice?SGWID
1-40359-0-0-0 - Directory of Open Access Journals
http//www.doaj.org - Lardy, J.P.- Le modèle de publication hybride
lecteur payant / auteur payant. Octobre 2006 - http//urfist.univ-lyon1.fr/publication_hybrid
e.pdf - Les outils du libre accès Métadonnées - Outils
de recherche services associés - Moissonneurs / agrégateurs
- OAISTER http//www.oaister.org/o/oaister
- ARC http//arc.cs.odu.edu/
- Outils commerciaux
- SCIRUS http//www.scirus.com
20Perspectives
IEML Du Web à lEspace sémantique Séminaire du
Laboratoire Paragraphe Université Paris-8, 5 juin
2007 Prof. Pierre Lévy Membre de lAcadémie des
sciences du Canada Directeur de la Chaire de
Recherche en Intelligence Collective Université
dOttawa http//www.ieml.org/text/Paris-8-IEML.pdf