Indizaci - PowerPoint PPT Presentation

About This Presentation
Title:

Indizaci

Description:

Indizaci n, Resumen y Catalogaci n Autom tica Piedad Garrido Picazo Francisco J. Mart nez Dom nguez Alberto Segrera Torres Introducci n INTRODUCCI N Proceso ... – PowerPoint PPT presentation

Number of Views:35
Avg rating:3.0/5.0
Slides: 19
Provided by: personale9
Category:
Tags: indizaci | resumen

less

Transcript and Presenter's Notes

Title: Indizaci


1
Indización, Resumen y Catalogación Automática
SRP
  • Piedad Garrido Picazo
  • Francisco J. Martínez Domínguez
  • Alberto Segrera Torres

2
  • Introducción
  • Productos desarrollados
  • Aplicación de las redes neuronales
  • Conclusiones

3
INTRODUCCIÓN
4
  • Proceso que permite captar y representar el
    contenido de un documento.
  • Identificación de los conceptos en lenguaje
    natural
  • Traslación de estos conceptos a su expresión por
    medio de un lenguaje controlado (normalizado)

5
  • Utiliza lenguajes de tipo documental, puesto que
    el lenguaje natural, presenta una eficacia muy
    limitada.
  • Si bien el lenguaje natural es simple y no
    requiere ningún esfuerzo de traducción, tiene un
    alto grado de ambigüedad que lo limita en un
    esfuerzo de sistematización de una determinada
    materia.

6
  • La indización automática, se limita a buscar los
    términos más representativos del documento y
    registrarlos.
  • Una máquina, en principio, es incapaz de realizar
    la labor de indizar, ya que no puede llegar a
    captar todos los matices conceptuales como puede
    hacerlo un indizador humano.
  • Sin embargo, es necesaria, pues la indización es
    el cuello de botella de la Catalogación.

7
  • Se emplean dos reglas en la indización
    automática
  • Los documentalistas deciden un conjunto de
    identificadores esta lista se compara en el
    ordenador con cada palabra del documento, si
    aparece algún identificador, se almacena como
    índice para ese documento.
  • Los documentalistas deciden un conjunto de
    palabras que NO deben ser seleccionadas como
    índice (antidiccionario) los sistemas
    automáticos cuentan el número de apariciones de
    las palabras no vacías y las más frecuentes serán
    elegidas como índices.

8
(No Transcript)
9
(No Transcript)
10
  • Durante el proceso de RESUMEN, el ordenador, crea
    una versión comprimida del texto original. Esta
    nueva versión deberá tener el mismo sentido que
    la anterior.
  • Es una tarea muy importante, pues las bibliotecas
    tienen que catalogar muchísimo material y si un
    ordenador puede realizar buenos resúmenes, se
    agiliza la catalogación.

11
PRODUCTOS DESARROLLADOS
12
Aplicación de las redes neuronales a la
indización automática
13
Nuestra meta es encontrar lo que quieres, no
sólo por lo que has preguntado
14
(No Transcript)
15
(No Transcript)
16
CONCLUSIONES
  • Se están desarrollando continuamente proyectos
    para automatizar las tareas documentales.
  • El nivel encontrado hasta ahora, cuando el
    volumen de información es pequeño, es bastante
    aceptable.
  • Se necesitan máquinas muy potentes para obtener
    buenos resultados.

17
CONCLUSIONES
  • La aparición de la multimedia ha dificultado más
    todavía, la consolidación de estos sistemas.
  • Existe una escasa presencia de investigadores del
    área de Biblioteconomía y Documentación, en el
    estudio de automatización de las tareas
    documentales.
  • En España existe muy poca tradición de
    investigación en este campo.

18
THAT'S ALL FOLKS
Write a Comment
User Comments (0)
About PowerShow.com