Les mtadonnes la Bibliothque nationale de France - PowerPoint PPT Presentation

About This Presentation
Title:

Les mtadonnes la Bibliothque nationale de France

Description:

Emmanuelle Berm s - emmanuelle.bermes_at_bnf.fr. Biblioth que nationale ... une gestion complexe des aspects administratifs (droits, suivi des volutions du ... – PowerPoint PPT presentation

Number of Views:40
Avg rating:3.0/5.0
Slides: 47
Provided by: DSR92
Category:

less

Transcript and Presenter's Notes

Title: Les mtadonnes la Bibliothque nationale de France


1
Les métadonnées à la Bibliothèque nationale de
France
  • Une vue densemble

Emmanuelle Bermès - emmanuelle.bermes_at_bnf.fr Bibli
othèque nationale de France Département de la
bibliothèque numérique
2
PLAN
  • Introduction
  • Métadonnées essai de définition
  • Décrire, représenter
  • Rôle des métadonnées descriptives
  • Lidentification
  • Rôle des métadonnées de structure
  • Préserver, administrer
  • Différents types de métadonnées de préservation
  • Lumière sur la gestion des droits
  • METS un format global
  • Partager, diffuser
  • Les métadonnées transformées les interfaces,
    lindexation
  • Un protocole déchange lOAI
  • Conclusion

3
Métadonnées essai de définition (1)
  • Des données sur les données ...
  • qui servent à organiser la connaissance et à
    utiliser et exploiter le document
  • internes ou externes
  • descriptives, contextuelles et structurelles
  • initiales et ajoutées tout au long du cycle de
    vie
  • qui servent à le maintenir accessible dans le
    temps et à garantir et contrôler cet accès
  • administratives et techniques
  • initiales et ajoutées tout au long du cycle de
    vie
  • NB certaines métadonnées sont communes aux deux
    types.

4
Métadonnées essai de définition (2)
  • les métadonnées ne sappliquent pas à une donnée
    mais à un ensemble de données signifiant
  • les métadonnées sont parfois comprises parmi les
    données de lensemble de données signifiant,
    parfois extérieures à lui
  • les métadonnées sont des données, soumises aux
    même défis de production, gestion, conservation
    que les données elles-mêmes...

5
Métadonnées essai de définition (3)
  • La gestion dun objet numérique complexe implique
  • une gestion complexe du descriptif (une ou
    plusieurs notices, descriptions à niveaux)
  • une gestion complexe des aspects techniques (sil
    y a différents formats de fichier par ex.)
  • une gestion complexe des aspects administratifs
    (droits, suivi des évolutions du document, suivi
    des évolutions des métadonnées)
  • une gestion complexe de sa structure physique
    (organisation des fichiers entre eux)
  • une gestion complexe de sa structure logique
    (organisation des parties du contenu entre elles)
  • Cest le rôle des métadonnées.

6
Métadonnées essai de définition (4)
Un document numérique / électronique, cest une
suite de fichiers sans lien entre eux
identifiant unique (localisation /
identification)
?
  • Métadonnées descriptives
  • rattacher le document à loriginal / différentes
    versions dun document
  • donner accès à la copie numérique / électronique
  • Métadonnées administratives
  • gérer la collection, cest-à-dire
  • gérer les droits daccès
  • préserver les informations techniques nécessaires
    à la lecture des fichiers
  • garantir l intégrité des fichiers et le suivi de
    leurs éventuelles modifications
  • Métadonnées de structure
  • rattacher les fichiers entre eux
  • reconstituer la structure du document

7
PLAN
  • Introduction
  • Métadonnées essai de définition
  • Décrire, représenter
  • Rôle des métadonnées descriptives
  • Lidentification
  • Rôle des métadonnées de structure
  • Préserver, administrer
  • Différents types de métadonnées de préservation
  • Lumière sur la gestion des droits
  • METS un format global
  • Partager, diffuser
  • Les métadonnées transformées les interfaces,
    lindexation
  • Un protocole déchange lOAI
  • Conclusion

8
Décrire, représenter
  • Les métadonnées descriptives
  • appréhender le contenu dun objet
  • description bibliographique approfondie et
    détaillée
  • identifier un objet ou un groupe dobjets
  • description bibliographique minimale
  • identifiant pérenne
  • identifier les parties qui composent un objet
  • information de structure
  • échanger des objets ou des descriptions dobjets
  • description bibliographique dans un format
    normalisé

9
Le rôle des métadonnées descriptives (1)
Dans le modèle OAIS Information didentification
Identification interne
Identification Globale
description de la ressource
URL
Cote d'origine
Auteur
ISBN
ID du fichier
Titre
Donne le moyen didentifier le document
10
Le rôle des métadonnées descriptives (2)
  • Une tradition dans les bibliothèques
  • Le catalogage création dinformation
    descriptive secondaire (notice) qui caractérise
    une information primaire (document)
  • Les métadonnées des données (secondaires) sur
    les données (primaires)
  • Caractéristiques du catalogage
  • un contenu normalisé ISBD, AACR...
  • Un format pour le traitement informatique MARC
    (Machine readable cataloguing)
  • une notice bibliographique cest
  • une description dun objet matériel
  • des  points daccès  pour retrouver le document
  • une localisation pour se le procurer

11
Le rôle des métadonnées descriptives (3)
  • Du catalogage aux métadonnées
  • les métadonnées
  • une description dun objet matériel ou non, les
    métadonnées peuvent être dans le document
    lui-même
  • multiplication des  points daccès ,
    information structurée
  • une localisation URL / URN / URI
  • De nouveaux formats
  • pour les notices Dublin Core, EAD formats
    dérivés de MARC en XML (MarcXML, MODS, BiblioML)
  • nouveau pour le contenu des documents
    eux-mêmes
  • autrefois on nentrait pas  dans  le document
  • nouveaux besoins OCR, tables des matières en
    saisie
  • nouveau formats TEI

12
Lidentification (1)
  • Problématique
  • passer dun nom de fichier à une URI
  • objectifs
  • de citabilité (pour les utilisateurs d une
    ressource)
  • didentification (pour les machines chargées de
    localiser une ressource sur un réseau)
  • fonctionnalités des identifiants (URN)
  • unicité - pérennité - granularité - adaptabilité
    - extensibilité - indépendance - résolution

13
Lidentification (2)
  • Les systèmes didentification existants et
    normalisés sur le plan international
  • systèmes non spécifiques au Web ISBN...
  • spécifications du W3C URI, URN, URL
  • systèmes de nommage du monde de lédition
    électronique Handle, DOI
  • systèmes de redirection PURL, POI
  • systèmes indépendants ARK
  • les propriétés de ARK
  • spécificité le  qualifier 

14
Le rôle des métadonnées de structure (1)
  • Les métadonnées de structure
  • connaître tous les fichiers qui composent un
    document
  • y compris les fichiers de différents formats
    (texte / image)
  • y compris les fichiers de différentes natures
    (versions)
  • connaître la relation physique entre ces fichiers
  • ordre daffichage
  • fichier cible qui donne accès à lensemble
  • ...
  • connaître la relation logique entre ces fichiers
  • délimitation de chapitres, de séries
  • détail du contenu dun fichier
  • ...

15
Le rôle des métadonnées de structure (2)
Collection
Document (notice bibliographique)
Vue de détail (article)
Volume, tome, fascicule...
Page
  • Un document complexe peut avoir plusieurs niveaux
    daccès ou niveaux de granularité
  • Document simple pas de problème de structure en
    soi, mais peut tout de même avoir plusieurs
    niveaux daccès

Vue de détail
Lot (notice bibliographique)
Image (légende)
Collection
16
Le rôle des métadonnées de structure (4)
Arborescence à gérer
Périodique Série Monogr. à Plusieurs Vol. (MPV)
Document Multimédia multi-support (MMS)
Ensemble
Groupe d'Objets
Volume Fascicule Cassette, disque, disque vinyle,
planche de diapos, disquette,
Page Fichier html Face d'un disque
Objet
Vue de détail (fichier image) Fichier texte
Fichier vidéo Fichier audio Image (d'une planche
de diapo, d'un fichier html)
Fichier
17
PLAN
  • Introduction
  • Métadonnées essai de définition
  • Décrire, représenter
  • Rôle des métadonnées descriptives
  • Lidentification
  • Rôle des métadonnées de structure
  • Préserver, administrer
  • Différents types de métadonnées de préservation
  • Lumière sur la gestion des droits
  • METS un format global
  • Partager, diffuser
  • Les métadonnées transformées les interfaces,
    lindexation
  • Un protocole déchange lOAI
  • Conclusion

18
Préserver, administrer
  • Les métadonnées administratives
  • métadonnées techniques
  • pour la conservation (migration, émulation)
  • pour la restitution (pour savoir comment
    visualiser ce quon a conservé)
  • métadonnées de gestion des droits
  • pour contrôler laccès (droits dauteur,
    confidentialité)
  • pour contrôler lusage (un fois quon a accédé au
    document, droit de limprimer, le copier, le
    modifier)
  • métadonnées de source et de provenance
  • pour faire le lien avec un document source /
    original, analogique ou non
  • pour conserver lhistorique des modifications
    subies par lobjet numérique

19
Métadonnées de préservation (1)
Dans le modèle OAIS Information de
Représentation
Matériel
Système d'exploitation
Compilateur Interpréteur
Format
Application
Microprocesseur
Nom
Nom
Nom
Nom
Multimedia
Version
Version
Version
Version
Périphérique
Instruction
20
Métadonnées de préservation (2)
  • Exemples de métadonnées techniques extraites
    automatiquement au niveau du fichier
  • caractéristiques techniques communes
  • File path
  • File name and extension
  • Former file name
  • File size
  • File date and time
  • MIME type
  • File format
  • File format version
  • Target indicator
  • caractéristiques techniques particulières
  • Image (récupérées à partir des en-têtes TIFF)
  • Audio
  • Video
  • Texte
  • Base de données
  • Fichiers systèmes (exécutables)

21
Gestion des droits (1)
  • Les droits de propriété intellectuelle
  • le droit moral
  • le droit patrimonial
  • droit de reproduction
  • droit de représentation
  • autres droits voisins, propriété industrielle
  • Conséquences pour le document numérique /
    électronique
  • sur la diffusion au public
  • sur la reproduction à des fins de conservation

22
Gestion des droits (2)
  • Droits dusage et droit daccès
  • un contexte dutilisation
  • quel type dutilisateur ?
  • quelle application ?
  • des permissions trouver, voir, imprimer,
    copier, modifier, détruire
  • des contraintes qualité, quantité, prix...

23
Gestion des droits (3)
  • Gestion des droits
  • Rights Declaration
  • Rights category
  • Other category type
  • Rights beginning date
  • Application duration
  • Rights end date
  • Rights contractref
  • Contract Type
  • Origin
  • Rights Holder
  • RightsHolder Name
  • RightsHolder Dates
  • RightsHolder Responsibility
  • Authority Record Reference
  • RightsHolder Comments
  • RightsHolder Contact
  • Users Rights - Context (Utilisateurs concernés
    par la déclaration des droits)
  • User type
  • Permissions
  • Constraints

24
METS un format global (1)
  • Metadata Encoding and Transmission Standard
    (METS)
  • implémentation du modèle de référence OAIS (Open
    Archival Information System)
  • schéma XML défini pour permettre la création dun
    fichier de métadonnées
  • contenant la description de la structure
    hiérarchique dobjets numériques constituant une
    ressource numérique
  • répertoriant les noms et la localisation des
    fichiers correspondant à ces objets
  • contenant toutes les métadonnées associées
  • descriptives
  • administratives (technique - source - droits -
    provenance)

25
METS un format global (2)
  • Conserver
  • METS permet de regrouper dans un seul fichier
  • toutes les métadonnées dun document
  • des pointeurs vers des métadonnées qui décrivent
    le document et sont stockées ailleurs
  • éventuellement, les fichiers qui composent le
    document
  • Il réserve une place particulière aux métadonnées
    techniques et administratives, essentielles pour
    la conservation à long terme du document
    numérique
  • Il préserve lintégrité des documents complexes
    grâce à une carte de structure

26
METS un format global (3)
  • Donner accès
  • grâce à un système élaboré de pointeurs, METS
    permet de relier entre eux les différents
    fichiers qui constituent un document, et de
    relier les métadonnées avec les fichiers quelles
    décrivent
  • grâce à la carte de structure, METS permet de
    reconstruire la navigation dans le document,
    quelle soit linéaire ou logique
  • METS est un schéma XML il est donc possible
    dutiliser les technologies XML standard pour
    réaliser une interface de consultation à partir
    dun fichier METS.

27
METS un format global (4)
  • Echanger
  • METS est un standard ouvert basé sur XML
  • Sappuyant sur des outils de collaboration (liste
    de discussion, exemples, METS implementation
    registry, partage doutils)
  • De plus en plus adopté notamment dans les
    bibliothèques
  • pour faciliter lintéropérabilité, il sappuie
    sur les METS application profiles

28
METS un format global (5)
  • 7 sections
  • Header informations sur le document METS
  • Descriptive metadata Section métadonnées
    descriptives externes ou encapsulées
  • Administrative metadata Section métadonnées
    techniques, droit, source, provenance
  • File section liste des fichiers composant
    lobjet
  • Structural map carte de structure, peut être
    logique ou physique, répétable
  • Structural links liens entre différents
    éléments de la carte de structure
  • Behavior association dexécutables

29
METS un format global (6)
  • Les blocs de métadonnées de METS sont des
     capsules , des enveloppes vides
  • quon remplit avec un lien (pointeur) vers autre
    chose
  • quon remplit avec des données dans un autre
    format
  • Les formats complémentaires
  • principaux formats XML de métadonnées
  • tout document en XML ou encodé en base 64
  • les schémas dextension

30
METS un format global (7)
  • Le système de pointeurs
  • Mdref xlink permet de pointer vers un bloc de
    métadonnées stocké autre part
  • DMDID, AMDID on utilise des identifiants,
    appliqués à chaque bloc de métadonnées, pour
    relier les blocs entre eux
  • fptr file pointer, permet de pointer vers
    lidentifiant dun fichier tel quon la donné
    dans la fileSec
  • mptr pointeur externe vers un autre fichier
    METS, permet darticuler plusieurs documents METS
    entre eux
  • area élément de la carte de structure qui
    permet de pointer non vers un fichier, mais vers
    une partie dun fichier

31
METS un format global (8)
  • Les relations entre les blocs de métadonnées

Mdref mptr
AMDID
DMDID
fptr
area
32
PLAN
  • Introduction
  • Métadonnées essai de définition
  • Décrire, représenter
  • Rôle des métadonnées descriptives
  • Lidentification
  • Rôle des métadonnées de structure
  • Préserver, administrer
  • Différents types de métadonnées de préservation
  • Lumière sur la gestion des droits
  • METS un format global
  • Partager, diffuser
  • Les métadonnées transformées les interfaces,
    lindexation
  • Un protocole déchange lOAI
  • Conclusion

33
Les interfaces et lindexation (1)
  • Les métadonnées descriptives servent à...
  • Trouver
  • dans le catalogue de bibliothèque
  • adapté pour la recherche avancée
  • accès intégré à loffre de la bibliothèque
    (numérique/analogique bibliothèque hybride)
  • avec un moteur de recherche
  • recherche simple conforme aux habitudes du web
  • recherche fine (mots-notice, tables et index en
    mode texte)
  • recherche plein texte (au-delà des seules
    métadonnées descriptives)

34
Les interfaces et lindexation (2)
  • Les métadonnées descriptives servent à...
  • Indexer
  • Les moteurs de recherche les utilisent pour
    indexer les documents
  • veiller à
  • laccessibilité des données
  • leur structuration
  • leur pérennité (identifiants)

35
Les interfaces et lindexation (3)
  • Les métadonnées descriptives servent à...
  • Découvrir laccès intuitif
  • la navigation par listes
  • liste d auteurs
  • liste de titres
  • lutilisation des classifications (Dewey)
  • par époques
  • par types de documents
  • par thèmes
  • vers les classifications  à facettes  ?

36
Les interfaces et lindexation (4)
  • Les métadonnées de structure servent à...
  • se repérer dans un document complexe
  • avoir une vue densemble du contenu
  • accéder à un niveau de granularité plus fin
  • Quelques pistes
  • la pagination (carte de structure physique)
  • la table des matières (carte de structure
    logique)
  • les vignettes

37
Un protocole déchange lOAI (1)
  • Plusieurs objectifs
  • mettre en place des collections numériques
    partagées
  • en France les pôles associés
  • avec des bibliothèques étrangères (projets
    thématiques)
  • améliorer la visibilité des ressources de la BnF
    sur le Web
  • dans des portails documentaires (Sudoc)
  • à travers des SP généralistes (OAIster)
  • à travers les moteurs de recherche (Yahoo)
  • améliorer la cohérence de loffre de ressources
    numériques de la BnF en interne
  • utilisation de lOAI pour créer un moteur de
    recherche fédéré sur lensemble des ressources
  • voir ex. de la BN dAustralie http//www.nla.gov.a
    u

38
Un protocole déchange lOAI (2)
  • Un protocole simple et ouvert
  • utilise des technologies ouvertes qui sont des
    standards reconnus sur le Web
  • protocole HTTP
  • langage XML
  • offre une grande liberté dapplication
  • indépendant des logiciels et des plateformes
  • développement simple et rapide ou approfondi et
    complexe
  • et une grande simplicité de mise en uvre
  • pas de modification des structures existantes, ce
    nest quune  couche  rajoutée au dessus de
    larchitecture de larchive

39
Un protocole déchange lOAI (3)
  • Un protocole largement répandu ...
  • dans les archives ouvertes,
  • dans les institutions patrimoniales et
    culturelles
  • dans le domaine de la recherche dinformation sur
    le Web
  • moteurs de recherche (Yahoo, Google)
  • portails documentaires (OAIster, ARC, portails de
    bibliothèques)

40
Un protocole déchange lOAI (4)
  • Un protocole qui répond aux questions que se
    posent aujourdhui les institutions...
  • comment diffuser largement et de manière ouverte,
    tout en gardant le contrôle sur mes données ?
  • Si je travaille en partenariat et en
    complémentarité avec dautres acteurs, comment
    maintenir mon image et mes flux dutilisateurs ?
  • Comment donner accès de manière simple (et
    transparente pour mes utilisateurs) à un nombre
    croissant de ressources, néanmoins choisies et
    validées ?
  • Comment gérer lévolution rapide de mes
    ressources, et de celles de mes partenaires, sans
    bouleverser sans cesse mon architecture et mes
    données ?

41
Un protocole déchange lOAI (5)
  • La création des métadonnées
  • récupération des notices du catalogue
  • transformation en Dublin Core
  • automatisée
  • avec des tables de conversion
  • concertation avec les partenaires
  • pour garantir lhomogénéité des données
    descriptives sur le réseau

42
Un protocole déchange lOAI (6)
  • Organisation de la collection dans lentrepôt
    pour faciliter le moissonnage sélectif
  • Création densembles (sets) pour trier les
    notices
  • par type de documents (monographies, manuscrits,
    cartes et plans )
  • par dossiers thématiques (sélection de
    documents), fonds documentaires (ensembles
    cohérents)
  • avec la classification Dewey pour permettre une
    sélection par thèmes
  • Possibilité dorganiser la collection de manière
    hiérarchique

43
Un protocole déchange lOAI (7)
  • Lentrepôt de la BnF aujourdhui
  • environ 30 000 notices au format DC simple
  • 64 ensembles thématiques ou collections décrites
    en DC
  • 26 000 monographies, 1300 cartes et plans, 2500
    manuscrits et ouvrages de la réserve

44
Conclusion
internautes
WEB
Accès
Visualisation
Entrepôt OAI métadonnées en DC
Traitement
notices
Tables des matières
Structure physique
Stockage des documents
Métadonnées descriptives catalogue
Stockage
Métadonnées en METS
Système darchivage
Production
prestataires
catalogueurs
extraction automatique
45
Conclusion
Enjeux des métadonnées
  • Les difficultés
  • mettre en place des outils
  • appliquer des normes
  • produire, traiter, maintenir les métadonnées
  • entraîne
  • les coûts
  • lorganisation
  • Les avantages
  • visibilité
  • préservation
  • possibilité dévolution
  • entraîne
  • gain de temps et de qualité
  • pour la préservation on ne peut pas en faire
    léconomie

46
Conclusion
  • Pour les bibliothèques, les métadonnées
    impliquent
  • une évolution des besoins
  • plus seulement des métadonnées descriptives
  • gestion de documents structurés ou à structurer
    (XML)
  • une évolution des compétences métier
  • augmentation des compétences techniques
  • gérer les compétences documentaires dans un
    environnement nouveau
  • un défi
  • continuer à remplir les missions de conservation
    et de communication dans un environnement nouveau
  • collaborer avec dautres acteurs que les
    bibliothèques
Write a Comment
User Comments (0)
About PowerShow.com