Title: METADATOS EN LA BIBLIOTECA DIGITAL
1- METADATOS EN LA BIBLIOTECA DIGITAL
Julián Cellini Claudia González Yanina González
Terán
Mónica Pené
Gustavo Archuby
Adrián Mastronardi
Karina Presta
2Temas
- Introducción
- Descripción de un recurso
- Implementación para la Interoperabilidad
3Introducción
- Desde el modelo tradicional
- ?
- Nuevo contexto
- Nuevas tecnologías de Información
- Metadatos en 3 niveles de acción
4Modelo tradicional
5Modelo Tradicional
USUARIOS
6Modelo Tradicional
USUARIOS
SRI
Borges El Aleph Bs. As. Sud. 1965
Autor Titulo Lugar Editorial Fecha
ISBD
ACR
Representación
CDU
MARC
TES
EM
7Nuevo Contexto
8Nuevo Contexto
USUARIOS
Multilingüismo
9Nuevo Contexto
USUARIOS
SRI
DR
Bca. Dig. Orig.
Multilingüismo
DC
W3C
10Evolución de las TI
- HTML ? METAETIQUETAS
- XML ? ESQUEMAS
- RDF ? PERFILES DE APLICACIÓN
11HTML - Metaetiquetas
- META
- ltHTMLgt
- ltHEADgt
- ltMETA NAME "DC.title" CONTENT"Hänsel und
Gretel"gt - ltMETA NAME "DC.creator" CONTENT"Grimm
Brothers"gt - ltMETA NAME "DC.language" CONTENT"de"gt
- ltMETA NAME "DC.subject" CONTENT "fairy tale,
Grimm Brothers, child protagonist, brother and
sister, woodcutter, stepmother, forest, poverty,
child neglect, witch, cannibalism"gt - ltMETA NAME "DC.format" CONTENT"text/html
images/gif audio/ra"gt - ltMETA NAME "DC.identifier" CONTENT"http//www.
vcu.edu/hasweb/for/grimm/haensel.html"gt - ltMETA NAME "DC.source" CONTENT"1857 edition
of Haus- und Kindermärchen der Brüder Grimm"gt - ltMETA NAME "DC.relation" CONTENT"Grimm fairy
tale number 15"gt - ltMETA NAME "DC.rights" CONTENT"Free use for
educational purposes"gt - ...
- LINK
- ltLINK rel"Index" href"../index.html"gt
- ltLINK rel"Next" href"Chapter3.html"gt
12XML
- lt?xml version"1.0" encoding"ISO-8859-1" ?gt
- ltCATALOGgt
- ltCDgt
- ltTITLEgtEmpire Burlesquelt/TITLEgt
- ltARTISTgtBob Dylanlt/ARTISTgt
- ltCOUNTRYgtUSAlt/COUNTRYgt
- ltCOMPANYgtColumbialt/COMPANYgt
- ltPRICEgt10.90lt/PRICEgt
- ltYEARgt1985lt/YEARgt
- lt/CDgt
- ltCDgt
- ....
13XML - Esquemas
- lt?xml version"1.0" encoding"UTF-8"?gt
- ltxsschema xmlnsxs"http//www.w3.org/2001/XMLSch
ema" - xmlns"http//purl.org/dc/elements/1.1/
" - targetNamespace"http//purl.org/dc/ele
ments/1.1/" - elementFormDefault"qualified"
- attributeFormDefault"unqualified"gt
- ...
- ltxselement name"any" type"SimpleLiteral"
abstract"true"/gt - ltxselement name"title" substitutionGroup"any"/
gt - ltxselement name"creator" substitutionGroup"any
"/gt - ltxselement name"subject" substitutionGroup"any
"/gt - ....
14RDF
- lt?xml version"1.0"?gt
- ltrdfRDF
- xmlnsrdfhttp//www.w3.org/1999/02/22-rdf-synta
x-ns xmlnsdchttp//purl.org/dc/elements/1.1/
gt - ltrdfDescription rdfaboutEl Alephgt
- ltdccreatorgtJ. L. Borgeslt/dccreatorgt
- lt/rdfDescriptiongt
- lt/rdfRDFgt
15Niveles de Acción
- Instanciación
- Estructuración
- Interoperabilidad
16Descripción de un recurso
17Descripción de un recurso
- El objeto de información
- Su forma
- Su identificación
- Su descripción
18Descripción de un recurso
- Diversidad de Estándares
- El estándar único
- El contexto del SID
- La semántica
19Descripción de un recurso
- La descripción
- Estándares de metadatos
- CDWA Standard
- Dublin Core
- Control de vocabulario y autoridades
- AAT / ULAN / ICONCLASS / TGN
20Página Catedral
21Descripción de un recurso
- Dublin Core
- Creator Alí Mustafa
- Title La Catedral de La Plata
- Publisher Organización de Estados
Iberoamericanos. Oficina Regional en Bogotá. CO - Date 1999 06
- Description Artículo sobre el reconocimiento que
hiciera el Vaticano a la Catedral de La Plata
como una de las más importantes del mundo. - Subject catedrales, construcciones religiosas,
neogótico - Coverge La Plata, Argentina
- Identifier http//www.oei.org.co/sii/entrega17/ar
t02.htm - CDWA
- Object/Work_Type catedral
- Creation_Creator_Identity Pedro Benoit
- Creation_Creator_Role arquitecto
- Titles or Names Text Catedral de La Plata
- Creation-Date 1884
- Current Location - Geographic Location La Plata,
Argentina - Subject Matter 11Q711
- Styles/Periods/Groups/Movements - Description De
las obras neogóticas en América, es una de las
más importantes.
22RDF
- Resource Description Farmework
23RDF
- Resource Description Farmework (RDF)
- Lenguaje para representar información acerca de
recursos - Pensado para el procesamiento automático
- Representa recursos que pueden identificarse en
la web
24Conceptos
- Metadatos para RDF
- El Aleph tiene como autor a J. L. Borges
25Problemas
- Lenguaje natural
- Ambiguo
- No entendible por una máquina
26Ambigüedad
- Cómo compartir información
- Qué es "El Aleph"?
- Qué significa autor?
- "J. L. Borges" o "Borges"?
- Qué pasa si hay dos "J. L. Borges"?
27Procesamiento
- No entendible por una máquina
- No tiene una sintaxis y semántica bien definida
- Se debe usar un lenguaje común (intercambio)
28Soluciones
- RDF resuelve estos problemas
- Ambigüedad ? Referencias URI
- Procesamiento automático ? XML
29URL
- URL (Uniform Resource Locator)
- Identifica un recurso Web mediante la
representación del mecanismo de acceso - Utiliza la ubicación en la red
- Ejemplos
- http//www.gidrid.com.ar/index.html
- ftp//ftp.mozilla.org
30URI
- URI (Uniform Resource Identifier)
- No están limitados a recursos web
- Pueden identificar personas, conceptos, etc.
- Todas las URL son URI
- Ejemplos
- todas las URL anteriores
- mailtoinfo_at_gidrid.com.ar
- urnisbn 950-04-0163-0
31Referencias URI
- RDF utiliza Referencias URI
- URI "" identificador de fragmento.
- Permiten identificar una parte de un recurso
- Ejemplo
- http//www.gidrid.com.ar/index.htmlstaff
32Ejemplo
- El Aleph tiene como autor a J. L. Borges
33XML
- El XML nos provee
- Namespaces
- Nos permite usar varios esquemas en un mismo XML
- XSLT
- Nos permite transformar un XML en otro
- Bibliotecas de funciones
- Lengua común
34Ejemplo
- lt?xml version"1.0"?gt
- ltrdfRDF
- xmlnsrdfhttp//www.w3.org/1999/02/22-rdf-synta
x-ns xmlnsdchttp//purl.org/dc/elements/1.1/
gt - ltrdfDescription rdfabout"urnisbn950-04-0163-
0gt - ltdccreator rdfresource
- "http//www.biblio.org.ar/personas/borgesjl.html
/gt - lt/rdfDescriptiongt
- lt/rdfRDFgt
35Ejemplo
- lt?xml version"1.0"?gt
- ltrdfRDF
- xmlnsrdfhttp//www.w3.org/1999/02/22-rdf-synta
x-ns xmlnsdchttp//purl.org/dc/elements/1.1/
gt - ltrdfDescription rdfabout"urnisbn950-04-0163-
0gt - ltdccreator rdfresource
- "http//www.biblio.org.ar/personas/borgesjl.html
/gt - lt/rdfDescriptiongt
- lt/rdfRDFgt
36Ejemplo
- lt?xml version"1.0"?gt
- ltrdfRDF
- xmlnsrdfhttp//www.w3.org/1999/02/22-rdf-synta
x-ns xmlnsdchttp//purl.org/dc/elements/1.1/
gt - ltrdfDescription rdfabout"urnisbn950-04-0163-
0gt - ltdccreator rdfresource
- "http//www.biblio.org.ar/personas/borgesjl.html
/gt - lt/rdfDescriptiongt
- lt/rdfRDFgt
37Ejemplo
- lt?xml version"1.0"?gt
- ltrdfRDF
- xmlnsrdfhttp//www.w3.org/1999/02/22-rdf-synta
x-ns xmlnsdchttp//purl.org/dc/elements/1.1/
gt - ltrdfDescription rdfabout"urnisbn950-04-0163-
0gt - ltdccreator rdfresource
- "http//www.biblio.org.ar/personas/borgesjl.html
/gt - lt/rdfDescriptiongt
- lt/rdfRDFgt
38Ejemplo
- lt?xml version"1.0"?gt
- ltrdfRDF
- xmlnsrdfhttp//www.w3.org/1999/02/22-rdf-synta
x-ns xmlnsdchttp//purl.org/dc/elements/1.1/
gt - ltrdfDescription rdfabout"urnisbn950-04-0163-
0gt - ltdccreatorgtJ. L. Borgeslt/dccreatorgt
- lt/rdfDescriptiongt
- lt/rdfRDFgt
39OAI-PMH
- Open Archives Initiative
- Protocol for Metadata Harvesting
40OAI-PMH
- Open Archives Initiative
- The Digital Library Federation (DLF)
- Coalition for Networked Information (CNI)
- National Science Foundation (NSF)
- Protocol for Metadata Harvesting
- HTTP
- XML
- Dublin Core
41Estrategias
- Búsqueda distribuida
- Recolección y centralización
42Búsqueda distribuida
- Diferencias entre leguajes de búsqueda
- Dificultad en procesar los resultados
- No escala bien
Server 1
Resultado 1
Exp
Server 2
Exp
Exp
Interfaz de búsqueda
Usuario
Resultado 2
Resultados 1 2 3 (Ordenados)
Exp
Server 3
Resultado 3
43Recolección y centralización
- Un solo lenguaje de búsqueda
- Una sola fuente de datos en la búsqueda
- Actualización en lotes
- Escala mejor
Server 1
Actualización
Proveedor de servicio
Server 2
Exp
Server Local
Interfaz de búsqueda
Usuario
Actualización
Resultados (Ordenados)
Actualización
Server 3
44Definiciones
- Recolector
- Cliente del Repositorio
- Concentrador
- Repositorio
- Servidor de datos
- Proveedor
GET/POST
Recolector
Repositorio
HTTP
XML
45 Definiciones
- Recurso
- Ítem
- Identificador
- Registro
- Conjunto
Recurso
Identificador MIRO723
Ítem Metadatos de la obra
Ítem Metadatos de la obra
Ítem Metadatos de la obra
Ítem Metadatos de la obra
Ítem Metadatos de la obra
Conjunto Pinturas
Ítem Metadatos de la obra
Ítem Metadatos de la obra
Registro DC
Registro Formato Propio
46Protocolo
- Basado en fecha de alta/baja/modificación
- Pide las novedades desde la última visita
- Requiere un identificador de registro
- Fácil de implementar
- Esquemas de metadatos
- DC no calificado (requerido)
- Otros pueden ser pedidos/provistos
47Preguntas?