Title: XXI Reuni
1La explotación cooperativa de contenidos en el
contexto de la Web Semántica
Diego Ferreyra
XXI Reunión del Foro deDirectores y Responsables
de Unidades de Información Documental Julio/2005
2Estándares en la Web
- 1945 Vannevar Bush As we May Think / Athlantic
Monthtly. (Memex) - 1965 Ted Nelson acuña el término hipertexto
(Xanadú) - 1986 Se publica la Norma ISO 8879 (SGML
Standard Generalized Markup Language) - 1991 Primera especificación HTML desarrollada por
Tim Berners-Lee - 1994 Primer borrador de HTML 2.0
- 1996 Encuentro en la Universidad de Warwick para
crear un marco de trabajo con metadatos - 1998 Extensible Markup Language (XML) 1.0
- 1999 RDF Model and Syntax Specification
3El marco Warwick DC-2
- Marzo de 1995 en Dublin (Ohio) se realiza el
primer encuentro ausipiciado por la Online
Computer Library Center (OCLC) y el National
Center for Supercomputing Applications (NCSA)
Dublin Core de 13 elementos. - En 1996 en la Universidad de Warwick se realiza
el segundo encuentro. Se acuerda desarrollar una
arquitectura - Modular diferentes tipos de metadatos
- Extensible nuevos tipos de metadatos
- Distribuida poder referir objetos externos
- Recursiva poder ser considerada a su vez como
contenido de información
4Tipos de estándares
- Visual Resources Association Data Standards
Committee - Estándares de contenidos
- AACR
- Estándares de estructuras de datos
- Dublin Core, VRA
- Estándares de comunicación
- MARC 21
- Estándares de valores
- Lenguajes controlados
5Mapa de lenguajes de metadatosRDF, XML, DCMI,
SVG, DALM, OIL, OWL, SOAP,WSDL
http//mapageweb.umontreal.ca/turner/meta/english/
metamap.html
6Web semántica
- XML (EXtensible Markup Language) DTD (Document
Type Definition) - RDF (Resource Description Framework) es una
recomendación del W3C, basado en XML, que
proporciona la tecnología para escribir metadatos
que describen recursos en la Web.
7Web semántica
- Una ontología es una descripción formal de los
conceptos y las relaciones entre conceptos.
(GRUBER, 1993) -
- Ontología es una descripción formal de
conceptos en el dominio de un discurso. Una
ontología es una especificación de una
conceptualización. - Las ontologías establecen una terminología
conjunta entre miembros de una comunidad de
interés. Estos miembros pueden ser humanos o
agentes automáticos. - En términos prácticos, el desarrollo de una
ontología incluye - o Definir clases en la ontología
- o Colocar las clases en un jerarquía de
taxonomías (subclase-superclase) - o Definir atributos y describir los
valores permitidos para esos atributos - o Rellenar los valores de los atributos
con ejemplos.
8Web semántica
- Inferencia de semántica a partir de estructuras
lógicas. - Logica XML
- basado en definiciones de tipos de datos
- basado en DTDs
- Semántica RDF
- basado en esquemas
- basado en declaración de relaciones (nominales y
referenciales)
9- http//www.r020.com.ar es un sitio que se llama
R020 -
- lthttp//www.r020.com.argt
- ltmeta name"DC.Title" content"R020" /gt
-
- ltrdfDescription rdfabout"http//www.r020.com.a
r/"gt - ltdctitlegtR020lt/dctitlegt
-
- Sujeto http//www.r020.com.ar/
- Predicado http//purl.org/dc/elements/1.1/title
- Objetohttp//www.anthus.com/CyberDewey/D020.html
10- Referencias a los esquemas utilizados
- lt?xml version"1.0"?gt
- ltrdfRDF
- xmlnsrdf"http//www.w3.org/1999/02/22-rd
f-syntax-ns" - xmlnsskos"http//www.w3.org/2004/02/skos
/core" - xmlnsdc"http//purl.org/dc/elements/1.1/
"gt - ltrdfDescription rdfabouthttp//www.r020.com.ar
/ - "gt
- ....
- lt/rdfDescriptiongt
- lt/rdfRDFgt
11- http//www.r020.com.ar/tematres/xml.php?skosTema6
80 - Metadatos literales
- ltdctitlegtTemaTreslt/dctitlegt
- ltdccreatorgtDiego Ferreyralt/dccreatorgt
- ltdcdescriptiongt
- Tesauro generalista para educación general básica
argentina. Tesauro de pruebas - lt/dcdescriptiongt
- Metadatos por URI
- ltskosConcept rdfabout"http//www.r020.com.ar/te
matres/index.php?tema680"gt - ltskosprefLabelgtCATALOGACIONlt/skosprefLabelgt
- ltskosinScheme rdfresource"http//www.r020.com.a
r/tematres/"/gt - ltskosnarrower rdfresource"http//www.r020.com.a
r/tematres/index.php?tema681"/gt - lt/skosConceptgt
12Web semántica
- Una semántica para programas.... no para humanos
-) - RDF procesamiento global e interoperable de la
información Web - Problemáticas de los lenguajes documentales
- Semántico o Sintáctico
13Web semántica
- Supuestos de la clasificación (J. H. Shera)
- Un orden universal
- Unidad del conocimiento
- Similaridad entre miembros de una clase
- Esencialidad intrínseca
- El idioma analítico de John Willkins / Jorge L.
Borges - Lenguaje como contrato ltgt lenguaje como
representación - El lenguaje establece un contrato y un compromiso
entre partes
14Ejemplos de explotación cooperativa
- Ejemplo basado en RDF
- RSS 1.0 RDF Site Summary
- Descripción simple de contenidos.
- Ejemplos
- http//www.r020.com.ar/rss/index.php
- http//www.r020.com.ar/clase/
- Ejemplo basado en XML
- Open Archive Initiative OAI
15Ejemplos de explotación cooperativa TemaTres
- TemaTres es una aplicación Web para la gestión de
lenguajes documentales. - Relaciones entre términos
- relaciones equivalencia (UP)
- relaciones jerárquicas (TE / TG)
- relaciones asociativas (TR)
- Navegación sistemática y alfabética
- Buscador
- Salidas
- SKOS-Core
- ZThes
16Ejemplos de explotación cooperativa TemaTres
17Explotación colaborativa basada en metadatos
- Folksnomy Folk (pueblo) taxonomy (taxonomía)
- Clasificaciones a partir de regularidades
lingüísticas emergentes. - Clasificación a partir de etiquetas (tags)
simples - Facilidad para incorporar la novedad lingüística
- Explotación de la inteligencia de la comunidad
- Navegación plana vocabulario controlado no
jerárquico - Ambigüedad / sinonimia
18Ejemplos de explotación colaborativa basadas en
metadatos
- Ejemplos
- http//del.icio.us/tag/
- http//www.flickr.com/photos/tags/
- http//www.technorati.com/tag/
- http//www.metafilter.com/tags.mefi
- http//www.43things.com/
- http//www.citeulike.org/tag/
19Ejemplos de explotación de relaciones basadas en
lenguaje natural
- Sin intervención humana en la categorización
- http//www.tenbyten.org/10x10.html
- Mapeador sobre el agregador de noticias del
Google News - http//www.marumushi.com/apps/newsmap/
20Lenguaje natural vs controlado?
- Iuri Lotman La semiosfera
- Espacio de realización de procesos comunicativos
y de producción de nueva información - Carácter delimitado la frontera dinámica
- Irregularidad semiótica
- Gramaticalidad / Textualidad
- Las sociedades en crisis son sociedades más
textualizadas que gramaticalizadas