Title: La alternativa: Introducci
1 La alternativa Introducción a XMLEduardo
PeisUniversidad de Granada
21. Resumen SGML
3SGML sintaxis básica (1) modelo de documento
declaración SGML
lt!SGML ISO 88791986 charset baseset ISO
646-1983//charset International Reference Version
(IRV)//ESC 2/5 4/0gt lt!DOCTYPE biblioteca system
c/sgml/biblioteca.dtdgt ltbibliotecagt lt!--
comienzo del registro de un libro
--gt ltlibrogt lttitulogtLos corsarios
vacilanteslt/titulogt ltautorgtPompeyo
Mañas ltemailgtpomp46mcu.eslt/emailgt lt/autorgt lted
itorialgtLaborlt/editorialgt ltcubierta
tipoblandagtlt/cubiertagt ltcategoría
clasenoficcióngtlt/categoríagt ltisbngt84-045-87498-
0lt/isbngt ltnota número5gtlt/notagt ltcomentariosgtLib
ro reservadolt/comentariosgt lt/librogt lt! más
registros aquí --gt lt/bibliotecagt
tipo de documento
entidad de sistema
contenido (PCDATA)
comentarios SGML
elementos
referencia de entidad
atributos
4SGML sintaxis básica (2) DTD Document Type
Definition-
5SGML sintaxis básica (2.1) declaración de
elementos
Indicadores de aparición
6SGML sintaxis básica (2.2) declaraciones de
lista de atributos
nombre de atributo
ltnombre nacionalidadSP sexoVgtEduardo
Peislt/nombregt
elemento al que cualifican
posibles valores AttrType
valor por defecto Default
nombre de atributo AttrName
lt!ATTLIST nombre nacionalidad (AU AS BG
SP NZ) SP sexo (V H) REQUIREDgt
7SGML sintaxis básica (2.3) declaraciones de
entidades
lt!DOCTYPE texto lt!ENTITY elemento-epr
lt!ELEMENT epr (PCDATA)gtgt elemento-epr gt
de parámetro
8SGML software
- Parsers analizadores
- Editores / procesadores
- Formateadores
- Conversores
- Gestión de datos
Es tal la potencialidad de SGML que no es posible
su explotación con el software de red disponible
en la actualidad
92. La alternativa XML
10SGML
SGML
XML
11El usurpador HTML
- HTML es, en realidad, un DTD SGML
- Problemas
- Define más la presentación que el contenido
- Escasas flexibilidad y extensibilidad
- No es fácilmente procesable por máquinas
- Problemas de internacionalización
- Estructura caótica
- Interpretación ambigua según el software
- Sólo tiene un uso páginas Web
- La convergencia XHTML
12HTML XML
lttablegt lttrgt lttdgttítulolt/tdgt lttdgtautorlt/td
gt lttdgtpreciolt/tdgt lt/trgt lttrgt lttdgtPensarlt/tdgt
lttdgtB. Ortegalt/tdgt lttdgt42lt/tdgt lt/trgt lttrgt
lttdgtLa leñalt/tdgt lttdgtM. Laolt/tdgt lttdgt53lt/tdgt
lt/trgt lt/tablegt
ltlibrosgt ltlibrogt lttitulogttítulolt/titulogt lta
utorgtautorlt/autorgt ltpreciogtpreciolt/preciogt lt/li
brogt ltlibrogt lttitulogtPensarlt/titulogt ltautorgtB
. Oñalt/autorgt ltpreciogt42lt/preciogt lt/librogt ltli
brogt lttitulogtLa leñalt/titulogt ltautorgtM.
Laolt/autorgt ltpreciogt53lt/preciogt lt/librogt lt/libr
ogt
13Principales diferencias SGML/XML
- Documentos XML well formed sin DTD
- Instrucciones de procesamiento
- Declaraciones de elementos. Modelos de contenido
- Conector no permitido
- Prohibidas las exception
- No se utilizan los indicadores de minimización.
- Uso generalizado de elementos vacíos
- Secciones cdata
- Notation declarations
- Los espacios en blanco, cambios de línea o
retornos son significativos
lt?xml version1.0 encodingISO-8859-1
standaloneyes?gt
ltElemento_ASPgt lt!CDATA ltFORM ACTIONlt
Request (SCRIPT_NAME) gt METHODPOSTgt
gt lt/Elemento_ASPgt
lt!NOTATION GIF SYSTEM Iexplore.exegt
14Documentos XML (1) Well-Formed
- Cumplen estrictamente la especificación (Versión
1.0) - Estructura jerárquica de los elementos
- Estrictamente jerárquica (árbol)
- Correctamente anidados
- No superposición
- Sólo un elemento raiz
- Etiquetas
- Siempre etiquetas de inicio y de fin
- Case-sensitive
- Comienzo de GIs
- Un carácter alfabético no acentuado
- Signo de subrayado o guión bajo
- Sin espacios
- Elementos vacíos sintaxis especial
- ltimg src./gt
- Atributos
- Valor de atributo entre comillas dobles () o
simples ()
15buena formación(well formed XML document)
- un elemento raiz
- etiquetas de principio y de final
- etiquetas vacías ltnombre /gt
- anidados correctos
- valores de atributos entre comillas
- distinción entre mayúsculas o minúsculas (se
pueden usar ambas, pero XML distingue entre
ambas) - caracteres admisibles (todos los nombres de las
etiquetas y atributos deben empezar siempre con
un carácter alfabético no acentuado o con el
signo subrayado o guión bajo y no pueden
contener ningún espacio).
16instrucciones de procesamiento
lt? Nombre_de_aplicación instrucciones_para_la_apli
cación ?gt
declaración XML lt?xml version1.0
encodingISO-8859-1 ?gt
- standalone
- lt?xml version1.0 encodingISO-8859-1
standaloneyes ?gt - yes (DTD interno)
- no (DTD externo o referencia externa a entidades)
17secciones CDATA
ltPeliculagt Tom Jerry lt/Peliculagt ..... ltElemento
_ASPgt ltFORM ACTIONlt Request (SCRIPT_NAME)
gtMETHODPOSTgt lt/Elemento_ASPgt
ltPeliculagtlt! CDATA Tom Jerry
gtlt/Peliculagt ..... ltElemento_ASPgt lt!
CDATAltFORM ACTIONlt Request (SCRIPT_NAME)
gtMETHODPOSTgtgt lt/Elemento_ASPgt
18referencia de entidades
Carácter Referencia textual Referencia numérica
lt lt 60
gt gt 62
amp 38
apos 39
quot 34
19referencia de entidades
ltCOMENTARIOgt El siguiente código es legal
ltPelículagt Tom amp Jerry
lt/Películagt lt/COMENTARIOgt
Comentarios lt!-- Este texto es un comentario --
gt lt!-- Esto es uncomentariopermitido -- gt lt!--
Esto es un --comentario--no permitido -- gt
20Documentos XML (2) Validación y definición
- XML well formed DTD valid XML
- XML Schemas
- Sintaxis XML
- Tipos de datos asociados a elementos (validación
de contenido) - Modelo de datos abierto
- vocabularios extensibles
- relaciones de herencia
- integración de Namespaces
- Combinación lógica de atributos
ltSchema xmlnsurnschemas-microsoft-comxml-data
xmlnsdturnschemas-microsoft-comdatatypes
gt ltAttributeType nameid dttypestring
requiredyes /gt ltElementType namenombre
contenttextOnly /gt ltElementType
namepersona contentmixed /gt ltattribute
typeid /gt ltelement typenombre
/gt lt/ElementTypegt ltElementType namedocumento
contenteltOnlygt ltelement typepersona
/gt lt/ElementTypegt lt/Schemagt
213. Recursos
22Tan sólo algunos recursos
Goldfarb, C. Prescod, P. (1999) Manual de XML. Madrid etc. Prentice Hall Traducción del manual de Goldfarb
http//www.w3.org Web del World Wide Web Consortium, donde se desarrollan, se oficializan y se distribuyen las especificaciones
http//www.oasis-open/cover/sgml-xml.html El sitio por excelencia
http//www.xml.com Recursos para desarrolladores. Contiene la especificación XML 1.0 comentada por Tim Bray
http//www.ibm.com/xml Borradores, tecnologías descargables, tutoriales
httpwww.microsoft.com/xml Buenos tutoriales, herramientas y demos
http//www.xmlsoftware.com Enlaces a herramientas XML