Desarrollos de servicios de valor a - PowerPoint PPT Presentation

About This Presentation
Title:

Desarrollos de servicios de valor a

Description:

Desarrollos de servicios de valor a adido Jos Manuel Barrueco Cruz Universitat de Val ncia La ecolog a de los repositorios institucionales Gij n, 12 a 14 de ... – PowerPoint PPT presentation

Number of Views:27
Avg rating:3.0/5.0
Slides: 24
Provided by: barr47
Category:

less

Transcript and Presenter's Notes

Title: Desarrollos de servicios de valor a


1
Desarrollos de servicios de valor añadido
  • José Manuel Barrueco Cruz
  • Universitat de València
  • La ecología de los repositorios institucionales
  • Gijón, 12 a 14 de Diciembre de 2007

2
Proveedores de servicios
  • Qué son?
  • Sistemas que utilizan los metadatos recolectados
    a través del protocolo OAI-PMH para construir
    servicios de valor añadido para los usuarios.
  • Algunos ejemplos
  • Agregadores de contenidos
  • Myoai, arc, perseus, oaister, scirus, carl abrc,
    base, dl-harvest, meind, Sheet Music Consortium,
    Electronic Library, America South, UIUC Digital
    Gateway to Cultural Heritage Materials, roai,
    Moissoneur oai-sist, Recolector Comunidad de
    Madrid, Metalis, oasic, oai repository explorer
  • Servicios avanzados
  • CiteBase

3
Proveedores de servicios
  • Agregadores de contenidos
  • Experimentales vs institucionales
  • Generales vs especializados
  • Funcionalidades
  • Búsqueda sencilla y avanzada en los metadatos
  • Diferentes criterios de ordenación de resultados
  • Navegación por documentos
  • Selección de depósitos donde buscar
  • Personalización del portal
  • RSS

4
Proveedores de servicios
  • Citebase
  • Indice de citas autónomo y experimental
  • Cobertura Física, Matemáticas, Documentación y
    Biomedicina
  • Rankings
  • Citas a documentos, impacto de autores,
  • Hits a documentos y autores
  • Cocitas
  • Limitaciones
  • Heterogéneo
  • Falta de integración
  • http//citebase.org

5
En conclusión
  • Imagen y vehículo para demostrar utilidad OA
  • Valores añadidos muy limitados
  • Audiencia difusa
  • Fácil crear un servicio / Difícil crear una
    audiencia
  • Competencia dura
  • Necesidad de mejorar para cumplir el objetivo
  • Maximizar el impacto al maximizar la difusión

6
En conclusión
  • Nuevos valores para cumplir objetivos
  • Selección y categorización
  • Importancia creciente
  • Criterios geográficos o temáticos
  • Enlace de referencias
  • Recuperación información
  • Extracción automática
  • Estadísticas

7
Selección y categorización
  • A posteriori, por los proveedores de servicios
  • Servicios temáticos
  • Categorización
  • North Carolina State Universitys Library Catalog
  • http//www.lib.ncsu.edu/catalog/
  • A priori, por los proveedores de datos
  • Utilización de la opción sets de OAI-PMH
  • Permite agrupar los items en un depósito para
    llevar a cabo una recolección selectiva en
    función del tipo de documento, materia, etc.
  • Estudio de sets en 94 archivos 80 respuestas
    válidas, 59 implementan sets

8
Selección y categorización
9
Selección y categorización
10
Selección y categorización
  • Es necesario enriquecer los metadatos
  • Utilizando formatos adicionales al requerido DC
  • Utilizando vocabularios controlados
  • Implementando control de autoridades iralis

11
Estadísticas
  • Fundamentales para demostrar el impacto de la
    literatura en abierto
  • Objetivo Demostrar!! que los documentos en
    abierto se citan más que el resto
  • Diferentes niveles de evaluación
  • Uso (accesos a abstract descargas)
  • Citas
  • Orientación a disciplinas
  • Integración

12
Estadísticas
  • Medidas de uso los fichero de logs

13
Estadísticas
  • Medidas de uso los fichero de logs
  • Necesario limpiarlos para identificar los accesos
    desde máquinas
  • Robots
  • Si han accedido /robots.txt
  • Han accedido más de x items (ejem 10.000)
  • Su red ha accedido a más del x de nuestro sitio
    (ejem 75)
  • Si pertenecen a un dominio como googlebot.com,
    inktomisearch.com, etc.
  • Doble clicks
  • Un único acceso por cada IP a un recurso
    determinado en un tiempo t
  • Reducción hasta de un 75 de los accesos

14
Estadísticas
  • Estadísticas para repositorios institucionales
  • IRStats
  • Software para analizar el uso de eprints en RI
  • Desarrollado en Universidad de Southampton
  • Procesa logs de EPrints y Dspace
  • Filtrado de robots
  • Analiza uso de documentos o grupos de documentos
    autores, temas, etc.
  • Ejemplos en
  • http//irstats.eprints.org/irstats-soton

15
Estadísticas
  • Estadísticas para repositorios institucionales
  • Distribución a través del modelo de Bollen
  • A framework for assessing the impact of units of
    scholarly communication based on OAI-PMH
    harvesting of usage information. Johan Bollen and
    Herbert van de Sompel
  • Proveedores de datos y proveedores de servicios
    ofrecen datos de acceso (logs) vía OAI-PMH
  • Metadatos ofrecidos Quién? Qué? Cuándo?
    Cómo?
  • Expresados en XML como ContextObjects de OpenURL
  • Recolectados por agregadores específicos

16
Estadísticas
17
Estadísticas
  • Estadísticas para repositorios temáticos
  • El caso de RePEc (Research Papers in Economics)
  • Biblioteca digital creada en 1997
  • 543.000 documentos a texto completo
  • procedentes de 850 departamentos (PD) y
    accesibles a través de 5 servicios (PS)
  • LogEc Servicio de estadísticas de uso
  • Datos de uso (logs) desde 01-Enero-1998
  • Elimina accesos de robots, spiders y duplicados
  • Sistema centralizado con intercambio de logs vía
    scp o ftp.
  • 26 millones de ficheros descargados
  • 120 millones de accesos a resúmenes
  • Rankings de autores, documentos, series, etc.
    (los top 10)
  • Ejemplos http//logec.repec.org

18
Análisis de citas
  • Recuperación de la información enlace de
    referencias
  • Medición del impacto de una publicación
  • Índices de citas autónomos
  • Citeseer
  • Citebase
  • CitEc

19
Citas Proceso de extracción
READING
Knowledge Base
Metadata
Full Text (PDF)
PARSING
PDF
ASCII
References
LINKING
Reference
Linking
CitationTemplate
20
Citas Proceso de comunicación
  • Necesidad de formatos para exportar referencias
  • Dublin Core
  • AMF Academic Metadata Format
  • Basado en XML
  • Permite describir documentos, personas e
    instituciones
  • Permite establecer las relaciones
  • cita ltreferencesgt
  • es citado ltisreferencedbygt

21
Citas Proceso de comunicación
22
Conclusiones
  • Es necesario crear PS con nuevos valores añadidos
  • Proveedores de servicios que
  • puedan competir con actores ya establecidos
  • estén centrados en una comunidad de usuarios
  • partan de un estudio de necesidades específicas
  • Necesario trabajar en
  • Selección y categorización
  • Análisis de uso y citas
  • Los proveedores de datos pueden facilitar el
    trabajo proporcionando más y mejores metadatos
  • Formatos alternativos
  • Metadatos completos
  • Nuevos datos logs y referencias

23
GRACIAS POR SU ATENCION ! José Manuel
Barrueco barrueco_at_uv.es
Write a Comment
User Comments (0)
About PowerShow.com