Title: Les mtadonnes la Bibliothque nationale de France
1Les métadonnées à la Bibliothèque nationale de
France
Emmanuelle Bermès - emmanuelle.bermes_at_bnf.fr Bibli
othèque nationale de France Département de la
bibliothèque numérique
2PLAN
- Introduction
- Métadonnées essai de définition
- Décrire, représenter
- Rôle des métadonnées descriptives
- Lidentification
- Rôle des métadonnées de structure
- Préserver, administrer
- Différents types de métadonnées de préservation
- Lumière sur la gestion des droits
- METS un format global
- Partager, diffuser
- Les métadonnées transformées les interfaces,
lindexation - Un protocole déchange lOAI
- Conclusion
3Métadonnées essai de définition (1)
- Des données sur les données ...
- qui servent à organiser la connaissance et à
utiliser et exploiter le document - internes ou externes
- descriptives, contextuelles et structurelles
- initiales et ajoutées tout au long du cycle de
vie - qui servent à le maintenir accessible dans le
temps et à garantir et contrôler cet accès - administratives et techniques
- initiales et ajoutées tout au long du cycle de
vie - NB certaines métadonnées sont communes aux deux
types.
4Métadonnées essai de définition (2)
- les métadonnées ne sappliquent pas à une donnée
mais à un ensemble de données signifiant - les métadonnées sont parfois comprises parmi les
données de lensemble de données signifiant,
parfois extérieures à lui - les métadonnées sont des données, soumises aux
même défis de production, gestion, conservation
que les données elles-mêmes...
5Métadonnées essai de définition (3)
- La gestion dun objet numérique complexe implique
- une gestion complexe du descriptif (une ou
plusieurs notices, descriptions à niveaux) - une gestion complexe des aspects techniques (sil
y a différents formats de fichier par ex.) - une gestion complexe des aspects administratifs
(droits, suivi des évolutions du document, suivi
des évolutions des métadonnées) - une gestion complexe de sa structure physique
(organisation des fichiers entre eux) - une gestion complexe de sa structure logique
(organisation des parties du contenu entre elles) - Cest le rôle des métadonnées.
6Métadonnées essai de définition (4)
Un document numérique / électronique, cest une
suite de fichiers sans lien entre eux
identifiant unique (localisation /
identification)
?
- Métadonnées descriptives
- rattacher le document à loriginal / différentes
versions dun document - donner accès à la copie numérique / électronique
- Métadonnées administratives
- gérer la collection, cest-à-dire
- gérer les droits daccès
- préserver les informations techniques nécessaires
à la lecture des fichiers - garantir l intégrité des fichiers et le suivi de
leurs éventuelles modifications
- Métadonnées de structure
- rattacher les fichiers entre eux
- reconstituer la structure du document
7PLAN
- Introduction
- Métadonnées essai de définition
- Décrire, représenter
- Rôle des métadonnées descriptives
- Lidentification
- Rôle des métadonnées de structure
- Préserver, administrer
- Différents types de métadonnées de préservation
- Lumière sur la gestion des droits
- METS un format global
- Partager, diffuser
- Les métadonnées transformées les interfaces,
lindexation - Un protocole déchange lOAI
- Conclusion
8Décrire, représenter
- Les métadonnées descriptives
- appréhender le contenu dun objet
- description bibliographique approfondie et
détaillée - identifier un objet ou un groupe dobjets
- description bibliographique minimale
- identifiant pérenne
- identifier les parties qui composent un objet
- information de structure
- échanger des objets ou des descriptions dobjets
- description bibliographique dans un format
normalisé
9Le rôle des métadonnées descriptives (1)
Dans le modèle OAIS Information didentification
Identification interne
Identification Globale
description de la ressource
URL
Cote d'origine
Auteur
ISBN
ID du fichier
Titre
Donne le moyen didentifier le document
10Le rôle des métadonnées descriptives (2)
- Une tradition dans les bibliothèques
- Le catalogage création dinformation
descriptive secondaire (notice) qui caractérise
une information primaire (document) - Les métadonnées des données (secondaires) sur
les données (primaires) - Caractéristiques du catalogage
- un contenu normalisé ISBD, AACR...
- Un format pour le traitement informatique MARC
(Machine readable cataloguing) - une notice bibliographique cest
- une description dun objet matériel
- des points daccès pour retrouver le document
- une localisation pour se le procurer
11Le rôle des métadonnées descriptives (3)
- Du catalogage aux métadonnées
- les métadonnées
- une description dun objet matériel ou non, les
métadonnées peuvent être dans le document
lui-même - multiplication des points daccès ,
information structurée - une localisation URL / URN / URI
- De nouveaux formats
- pour les notices Dublin Core, EAD formats
dérivés de MARC en XML (MarcXML, MODS, BiblioML) - nouveau pour le contenu des documents
eux-mêmes - autrefois on nentrait pas dans le document
- nouveaux besoins OCR, tables des matières en
saisie - nouveau formats TEI
12Lidentification (1)
- Problématique
- passer dun nom de fichier à une URI
- objectifs
- de citabilité (pour les utilisateurs d une
ressource) - didentification (pour les machines chargées de
localiser une ressource sur un réseau) - fonctionnalités des identifiants (URN)
- unicité - pérennité - granularité - adaptabilité
- extensibilité - indépendance - résolution
13Lidentification (2)
- Les systèmes didentification existants et
normalisés sur le plan international - systèmes non spécifiques au Web ISBN...
- spécifications du W3C URI, URN, URL
- systèmes de nommage du monde de lédition
électronique Handle, DOI - systèmes de redirection PURL, POI
- systèmes indépendants ARK
- les propriétés de ARK
- spécificité le qualifier
14Le rôle des métadonnées de structure (1)
- Les métadonnées de structure
- connaître tous les fichiers qui composent un
document - y compris les fichiers de différents formats
(texte / image) - y compris les fichiers de différentes natures
(versions) - connaître la relation physique entre ces fichiers
- ordre daffichage
- fichier cible qui donne accès à lensemble
- ...
- connaître la relation logique entre ces fichiers
- délimitation de chapitres, de séries
- détail du contenu dun fichier
- ...
15Le rôle des métadonnées de structure (2)
Collection
Document (notice bibliographique)
Vue de détail (article)
Volume, tome, fascicule...
Page
- Un document complexe peut avoir plusieurs niveaux
daccès ou niveaux de granularité - Document simple pas de problème de structure en
soi, mais peut tout de même avoir plusieurs
niveaux daccès
Vue de détail
Lot (notice bibliographique)
Image (légende)
Collection
16Le rôle des métadonnées de structure (4)
Arborescence à gérer
Périodique Série Monogr. à Plusieurs Vol. (MPV)
Document Multimédia multi-support (MMS)
Ensemble
Groupe d'Objets
Volume Fascicule Cassette, disque, disque vinyle,
planche de diapos, disquette,
Page Fichier html Face d'un disque
Objet
Vue de détail (fichier image) Fichier texte
Fichier vidéo Fichier audio Image (d'une planche
de diapo, d'un fichier html)
Fichier
17PLAN
- Introduction
- Métadonnées essai de définition
- Décrire, représenter
- Rôle des métadonnées descriptives
- Lidentification
- Rôle des métadonnées de structure
- Préserver, administrer
- Différents types de métadonnées de préservation
- Lumière sur la gestion des droits
- METS un format global
- Partager, diffuser
- Les métadonnées transformées les interfaces,
lindexation - Un protocole déchange lOAI
- Conclusion
18Préserver, administrer
- Les métadonnées administratives
- métadonnées techniques
- pour la conservation (migration, émulation)
- pour la restitution (pour savoir comment
visualiser ce quon a conservé) - métadonnées de gestion des droits
- pour contrôler laccès (droits dauteur,
confidentialité) - pour contrôler lusage (un fois quon a accédé au
document, droit de limprimer, le copier, le
modifier) - métadonnées de source et de provenance
- pour faire le lien avec un document source /
original, analogique ou non - pour conserver lhistorique des modifications
subies par lobjet numérique
19Métadonnées de préservation (1)
Dans le modèle OAIS Information de
Représentation
Matériel
Système d'exploitation
Compilateur Interpréteur
Format
Application
Microprocesseur
Nom
Nom
Nom
Nom
Multimedia
Version
Version
Version
Version
Périphérique
Instruction
20Métadonnées de préservation (2)
- Exemples de métadonnées techniques extraites
automatiquement au niveau du fichier
- caractéristiques techniques communes
- File path
- File name and extension
- Former file name
- File size
- File date and time
- MIME type
- File format
- File format version
- Target indicator
- caractéristiques techniques particulières
- Image (récupérées à partir des en-têtes TIFF)
- Audio
- Video
- Texte
- Base de données
- Fichiers systèmes (exécutables)
21Gestion des droits (1)
- Les droits de propriété intellectuelle
- le droit moral
- le droit patrimonial
- droit de reproduction
- droit de représentation
- autres droits voisins, propriété industrielle
- Conséquences pour le document numérique /
électronique - sur la diffusion au public
- sur la reproduction à des fins de conservation
22Gestion des droits (2)
- Droits dusage et droit daccès
- un contexte dutilisation
- quel type dutilisateur ?
- quelle application ?
- des permissions trouver, voir, imprimer,
copier, modifier, détruire - des contraintes qualité, quantité, prix...
23Gestion des droits (3)
- Rights Declaration
- Rights category
- Other category type
- Rights beginning date
- Application duration
- Rights end date
- Rights contractref
- Contract Type
- Origin
- Rights Holder
- RightsHolder Name
- RightsHolder Dates
- RightsHolder Responsibility
- Authority Record Reference
- RightsHolder Comments
- RightsHolder Contact
- Users Rights - Context (Utilisateurs concernés
par la déclaration des droits) - User type
24METS un format global (1)
- Metadata Encoding and Transmission Standard
(METS) - implémentation du modèle de référence OAIS (Open
Archival Information System) - schéma XML défini pour permettre la création dun
fichier de métadonnées - contenant la description de la structure
hiérarchique dobjets numériques constituant une
ressource numérique - répertoriant les noms et la localisation des
fichiers correspondant à ces objets - contenant toutes les métadonnées associées
- descriptives
- administratives (technique - source - droits -
provenance)
25METS un format global (2)
- Conserver
- METS permet de regrouper dans un seul fichier
- toutes les métadonnées dun document
- des pointeurs vers des métadonnées qui décrivent
le document et sont stockées ailleurs - éventuellement, les fichiers qui composent le
document - Il réserve une place particulière aux métadonnées
techniques et administratives, essentielles pour
la conservation à long terme du document
numérique - Il préserve lintégrité des documents complexes
grâce à une carte de structure
26METS un format global (3)
- Donner accès
- grâce à un système élaboré de pointeurs, METS
permet de relier entre eux les différents
fichiers qui constituent un document, et de
relier les métadonnées avec les fichiers quelles
décrivent - grâce à la carte de structure, METS permet de
reconstruire la navigation dans le document,
quelle soit linéaire ou logique - METS est un schéma XML il est donc possible
dutiliser les technologies XML standard pour
réaliser une interface de consultation à partir
dun fichier METS.
27METS un format global (4)
- Echanger
- METS est un standard ouvert basé sur XML
- Sappuyant sur des outils de collaboration (liste
de discussion, exemples, METS implementation
registry, partage doutils) - De plus en plus adopté notamment dans les
bibliothèques - pour faciliter lintéropérabilité, il sappuie
sur les METS application profiles
28METS un format global (5)
- 7 sections
- Header informations sur le document METS
- Descriptive metadata Section métadonnées
descriptives externes ou encapsulées - Administrative metadata Section métadonnées
techniques, droit, source, provenance - File section liste des fichiers composant
lobjet - Structural map carte de structure, peut être
logique ou physique, répétable - Structural links liens entre différents
éléments de la carte de structure - Behavior association dexécutables
29METS un format global (6)
- Les blocs de métadonnées de METS sont des
capsules , des enveloppes vides - quon remplit avec un lien (pointeur) vers autre
chose - quon remplit avec des données dans un autre
format - Les formats complémentaires
- principaux formats XML de métadonnées
- tout document en XML ou encodé en base 64
- les schémas dextension
30METS un format global (7)
- Le système de pointeurs
- Mdref xlink permet de pointer vers un bloc de
métadonnées stocké autre part - DMDID, AMDID on utilise des identifiants,
appliqués à chaque bloc de métadonnées, pour
relier les blocs entre eux - fptr file pointer, permet de pointer vers
lidentifiant dun fichier tel quon la donné
dans la fileSec - mptr pointeur externe vers un autre fichier
METS, permet darticuler plusieurs documents METS
entre eux - area élément de la carte de structure qui
permet de pointer non vers un fichier, mais vers
une partie dun fichier
31METS un format global (8)
- Les relations entre les blocs de métadonnées
Mdref mptr
AMDID
DMDID
fptr
area
32PLAN
- Introduction
- Métadonnées essai de définition
- Décrire, représenter
- Rôle des métadonnées descriptives
- Lidentification
- Rôle des métadonnées de structure
- Préserver, administrer
- Différents types de métadonnées de préservation
- Lumière sur la gestion des droits
- METS un format global
- Partager, diffuser
- Les métadonnées transformées les interfaces,
lindexation - Un protocole déchange lOAI
- Conclusion
33Les interfaces et lindexation (1)
- Les métadonnées descriptives servent à...
- Trouver
- dans le catalogue de bibliothèque
- adapté pour la recherche avancée
- accès intégré à loffre de la bibliothèque
(numérique/analogique bibliothèque hybride) - avec un moteur de recherche
- recherche simple conforme aux habitudes du web
- recherche fine (mots-notice, tables et index en
mode texte) - recherche plein texte (au-delà des seules
métadonnées descriptives)
34Les interfaces et lindexation (2)
- Les métadonnées descriptives servent à...
- Indexer
- Les moteurs de recherche les utilisent pour
indexer les documents - veiller à
- laccessibilité des données
- leur structuration
- leur pérennité (identifiants)
35Les interfaces et lindexation (3)
- Les métadonnées descriptives servent à...
- Découvrir laccès intuitif
- la navigation par listes
- liste d auteurs
- liste de titres
- lutilisation des classifications (Dewey)
- par époques
- par types de documents
- par thèmes
- vers les classifications à facettes ?
36Les interfaces et lindexation (4)
- Les métadonnées de structure servent à...
- se repérer dans un document complexe
- avoir une vue densemble du contenu
- accéder à un niveau de granularité plus fin
- Quelques pistes
- la pagination (carte de structure physique)
- la table des matières (carte de structure
logique) - les vignettes
37Un protocole déchange lOAI (1)
- Plusieurs objectifs
- mettre en place des collections numériques
partagées - en France les pôles associés
- avec des bibliothèques étrangères (projets
thématiques) - améliorer la visibilité des ressources de la BnF
sur le Web - dans des portails documentaires (Sudoc)
- à travers des SP généralistes (OAIster)
- à travers les moteurs de recherche (Yahoo)
- améliorer la cohérence de loffre de ressources
numériques de la BnF en interne - utilisation de lOAI pour créer un moteur de
recherche fédéré sur lensemble des ressources - voir ex. de la BN dAustralie http//www.nla.gov.a
u
38Un protocole déchange lOAI (2)
- Un protocole simple et ouvert
- utilise des technologies ouvertes qui sont des
standards reconnus sur le Web - protocole HTTP
- langage XML
- offre une grande liberté dapplication
- indépendant des logiciels et des plateformes
- développement simple et rapide ou approfondi et
complexe - et une grande simplicité de mise en uvre
- pas de modification des structures existantes, ce
nest quune couche rajoutée au dessus de
larchitecture de larchive
39Un protocole déchange lOAI (3)
- Un protocole largement répandu ...
- dans les archives ouvertes,
- dans les institutions patrimoniales et
culturelles - dans le domaine de la recherche dinformation sur
le Web - moteurs de recherche (Yahoo, Google)
- portails documentaires (OAIster, ARC, portails de
bibliothèques)
40Un protocole déchange lOAI (4)
- Un protocole qui répond aux questions que se
posent aujourdhui les institutions... - comment diffuser largement et de manière ouverte,
tout en gardant le contrôle sur mes données ? - Si je travaille en partenariat et en
complémentarité avec dautres acteurs, comment
maintenir mon image et mes flux dutilisateurs ? - Comment donner accès de manière simple (et
transparente pour mes utilisateurs) à un nombre
croissant de ressources, néanmoins choisies et
validées ? - Comment gérer lévolution rapide de mes
ressources, et de celles de mes partenaires, sans
bouleverser sans cesse mon architecture et mes
données ?
41Un protocole déchange lOAI (5)
- La création des métadonnées
- récupération des notices du catalogue
- transformation en Dublin Core
- automatisée
- avec des tables de conversion
- concertation avec les partenaires
- pour garantir lhomogénéité des données
descriptives sur le réseau
42Un protocole déchange lOAI (6)
- Organisation de la collection dans lentrepôt
pour faciliter le moissonnage sélectif - Création densembles (sets) pour trier les
notices - par type de documents (monographies, manuscrits,
cartes et plans ) - par dossiers thématiques (sélection de
documents), fonds documentaires (ensembles
cohérents) - avec la classification Dewey pour permettre une
sélection par thèmes - Possibilité dorganiser la collection de manière
hiérarchique
43Un protocole déchange lOAI (7)
- Lentrepôt de la BnF aujourdhui
- environ 30 000 notices au format DC simple
- 64 ensembles thématiques ou collections décrites
en DC - 26 000 monographies, 1300 cartes et plans, 2500
manuscrits et ouvrages de la réserve
44Conclusion
internautes
WEB
Accès
Visualisation
Entrepôt OAI métadonnées en DC
Traitement
notices
Tables des matières
Structure physique
Stockage des documents
Métadonnées descriptives catalogue
Stockage
Métadonnées en METS
Système darchivage
Production
prestataires
catalogueurs
extraction automatique
45Conclusion
Enjeux des métadonnées
- Les difficultés
- mettre en place des outils
- appliquer des normes
- produire, traiter, maintenir les métadonnées
- entraîne
- les coûts
- lorganisation
- Les avantages
- visibilité
- préservation
- possibilité dévolution
- entraîne
- gain de temps et de qualité
- pour la préservation on ne peut pas en faire
léconomie
46Conclusion
- Pour les bibliothèques, les métadonnées
impliquent - une évolution des besoins
- plus seulement des métadonnées descriptives
- gestion de documents structurés ou à structurer
(XML) - une évolution des compétences métier
- augmentation des compétences techniques
- gérer les compétences documentaires dans un
environnement nouveau - un défi
- continuer à remplir les missions de conservation
et de communication dans un environnement nouveau - collaborer avec dautres acteurs que les
bibliothèques