Sesin 5' Los tesauros - PowerPoint PPT Presentation

1 / 13
About This Presentation
Title:

Sesin 5' Los tesauros

Description:

... natural (como hablamos normalmente) es muy variado y rico en sin nimos y ... Veamos un ejemplo muy sencillo del problema que nos plantea el lenguaje natural ... – PowerPoint PPT presentation

Number of Views:21
Avg rating:3.0/5.0
Slides: 14
Provided by: x7444
Category:

less

Transcript and Presenter's Notes

Title: Sesin 5' Los tesauros


1
Sesión 5. Los tesauros
  • Qué es un tesauro?
  • Un tesauro es un vocabulario controlado y
    estructurado formalmente, formado por términos
    que guardan entre sí relaciones semánticas y
    genéricas de equivalencia, jerárquicas y
    asociativas.
  • Se trata de un instrumento de control
    terminológico que permite convertir el lenguaje
    natural de los documentos en un lenguaje
    controlado, ya que representa, de manera unívoca,
    el contenido de estos, con el fin de servir tanto
    para la indización, como para la recuperación de
    los documentos.
  • (tomado de http//www.hipertexto.info/documentos/t
    esauros.htm)

2
Sesión 5. Los tesauros
  • Veamos con detenimiento qué es esto

3
Sesión 5. Los tesauros
  • Un tesauro es un vocabulario controlado.
  • El lenguaje natural (como hablamos normalmente)
    es muy variado y rico en sinónimos y eso
    dificulta la descripción de los documentos y
    también la elección de las palabras cuando
    queremos buscar una información.
  • Veamos un ejemplo muy sencillo del problema que
    nos plantea el lenguaje natural cuando queremos
    describir un documento.
  • Tratemos de describir con un término el concepto
    que representa cada una de estas imágenes

4
Sesión 5. Los tesauros
  • Coche
  • Automóvil
  • Vehículo
  • Auto
  • Turismo
  • Bicicleta
  • Bici
  • Mountain bike
  • Sudamérica
  • América del Sur
  • Hispanoamérica
  • Latinoamérica
  • América Latina

Es decir, el lenguaje natural nos permite definir
el mismo concepto con distintos términos y eso
dificulta la indización de los documentos y la
búsqueda y recuperación de los mismos. Veamos
los problemas que podría dar la utilización del
lenguaje natural en una búsqueda de información.
5
Sesión 5. Los tesauros
Pepe, María y Eva buscan información
Documento 1 América Latina
Pepe busca América Latina
Documento 2 América del Sur
María busca Latinoamérica
Documento 3 Hispanoamérica
Documento 4 Latinoamérica
Eva busca Sudamérica
Documento 5 América Latina
Pepe, María y Eva tienen la misma necesidad de
información y sin embargo obtienen diferentes
resultados, ya que utilizan distintos términos de
búsqueda y los documentos no están descritos con
un lenguaje controlado.
6
Sesión 5. Los tesauros
  • El objetivo de los tesauros es que cada concepto
    esté identificado por una única palabra para que
    podamos entenderlos de manera unívoca. Por lo
    tanto Un tesauro es un vocabulario controlado
    ...
  • Además de vocabulario controlado hemos dicho que
    está estructurado y formado por términos.
  •   Efectivamente los tesauros se presentan en
    forma de listados y estos listados nos muestran
    los términos que tenemos que emplear, es decir,
    los que se han considerado como aceptados o
    normalizados (se llaman descriptores) pero
    también los que se han considerado como no
    aceptados.
  • El hecho de que en los listados haya un gran
    número de términos y que haya términos aceptados
    y no aceptados nos lleva al siguiente punto de la
    definición Los términos presentan relaciones
    entre sí.

7
Sesión 5. Los tesauros
  • Los términos del tesauro presentan relaciones
    entre sí
  • Las relaciones nos indican si un término debe
    emplearse en lugar de otro, si un término es
    específico dentro de otro más general, si está
    relacionado con otro, etc.
  • Veamos el ejemplo de un hipotético tesauro para
    el término automóvil
  • Automóvil
  •  
  • UP (Usado Por) Coche
  • UP (Usado Por) Auto
  •  
  • TE (Término Específico) Turismo
  • TE (Término Específico) Deportivo
  • TE (Término Específico) Monovolumen
  • TE (Término Específico) 4x4
  •  
  • TG (Término Genérico) Transporte terrestre

8
Sesión 5. Los tesauros
  • Automóvil
  •  
  • UP (Usado Por) Coche
  • UP (Usado Por) Auto
  •  
  • TE (Término Específico) Turismo
  • TE (Término Específico) Deportivo
  • TE (Término Específico) Monovolumen
  • TE (Término Específico) 4x4
  •  
  • TG (Término Genérico) Transporte terrestre

Automóvil es el término aceptado
Coche y Auto no están aceptados y es Automóvil el
que se usa en su lugar.
Estas son las relaciones entre los términos
Dentro de un término puede haber otros términos
más específicos
El término Automóvil pertenece a otro más genérico
9
Sesión 5. Los tesauros
  • En la definición inicial se decía que la
    finalidad de un tesauro es servir tanto para la
    indización, como para la recuperación de los
    documentos.
  • Así es, un tesauro sirve a
  • Los documentalistas, que realizan el análisis
    documental, para decidir cual es el término o
    términos que describen adecuadamente un
    documento.
  • La persona que busca información para facilitarle
    el término con el que va a realizar una búsqueda.
    Las bases de datos suelen tener un acceso al
    tesauro para que el usuario elija el término de
    búsqueda aceptado, sin embargo también hay casos
    en los que el tesauro está integrado internamente
    sin que el usuario tenga que interactuar con él
    de manera separada.
  • Veamos la doble utilidad del tesauro en la
    siguiente imagen

10
Sesión 5. Los tesauros
Documentos
4
Recuperan documentos
1
Profesionales de la Comunicación
analizan
3
Documentalistas
Expresan su necesidad de información
2
extraen
Términos de indización (TESAURO)
11
Sesión 5. Los tesauros
  • Cuándo se necesita un tesauro?
  • Cuando se posee un gran número de documentación
    y de información no estructurada y se necesita
    manejarla y acceder a ella de manera eficiente.
  • En muchas ocasiones un motor de búsqueda de
    texto completo no recupera la información de
    manera adecuada ya que produce ruido documental
    y/o silencio documental y es necesario que la
    documentación esté tratada documentalmente
    usándose un tesauro.

12
Sesión 5. Los tesauros
  • Qué tesauros existen?
  • Existen más tesauros en el ámbito de las
    Ciencias y la tecnología, después en las Ciencias
    Sociales y por último en las Humanidades.
  • La mayoría de los tesauros se desarrollan para
    aplicarlos a una determinada base de datos. Son
    muchos los medios de comunicación cuyos centros
    de documentación han desarrollado sus propios
    tesauros.

13
Sesión 5. Los tesauros
  • Para completar la explicación es necesario
    consultar los siguientes tesauros
  • Tesauro de la UNESCO
  • Tesauros del CINDOC
  • Se recomiendan también las lecturas propuestas
    por el profesor Orihuela
  • Consideraciones sobre los tesauros
  • Los lenguajes documentales
  • Los tesauros como herramientas terminológicas
  • Tesauros
Write a Comment
User Comments (0)
About PowerShow.com