Title: Bases de datos distribuidas
1Bases de datos distribuidas
- Carlos Rojas Kramer
- Universidad Cristóbal Colón
2OrÃgenes
- Evolución acelerada de los sistemas de
información - Crecimiento no planeado de la información al
interior de las organizaciones - Dispersión en sitios geográficamente distantes
- Sistemas tecnológicamente diferentes
3OrÃgenes
- Necesidad de compartir e integrar la información
dispersa - Se requiere un tipo de tecnologÃa diferente al
tradicional - La Base de Datos Distribuida es una buena
solución a lo anterior.
4Definición
- Una Base de Datos Distribuida (BDD) es una
colección de datos relacionados lógicamente, pero
dispersos entre diversos sitios de una red de
computadoras. Ceri y Pelagatti - Cada sitio en la red tiene capacidad de
procesamiento autónomo y puede ejecutar
aplicaciones locales.
5BDD (ilustración esquemática)
6Razones para la dispersión
- Naturaleza de la información
- Motivos económicos
- Consideraciones de desempeño
- Necesidades de fiabilidad
- Requerimientos de disponibilidad
- Etc.
7Consecuencias de la dispersión
- Incremento en la complejidad de diseño
- Mayores dificultades para la instrumentación de
las soluciones - Administración y resolución de problemas implican
aplicación de mejores recursos - Necesidad de apego a estándares
8Software para BDD
- DDBMS Distributed DataBase Management System
- Debe permitir la creación, el uso y el
mantenimiento de la BDD - Debe realizar funciones tÃpicas de un DBMS no
distribuido - También debe soportar otras funciones
9Funciones extra para un DDBMS
- Capacidad de accesar sitios remotos y transmitir
consultas y datos entre diversos sitios a través
de una red de computadoras - Capacidad de rastrear la pista de distribución y
de replicación de los datos en el catálogo del
DDBMS
10- Capacidad de elaborar estrategias de ejecución
para consultas y transacciones que accesan datos
en más de un sitio - Capacidad de mantener la consistencia en las
copias de un elemento de información
11- Capacidad de recuperarse ante caÃdas de sitios
individuales y fallos de un enlace de
comunicación - Capacidad de decidir cual de las copias de un
elemento de información será accesada
12Componentes de un DDBMS
- Componente de manejo de Base de Datos (DB)
- El componente de Comunicación de Datos (DC)
- El Diccionario de Datos (DD), el cual es
extendido para representar información sobre la
distribución de los datos sobre la red - El componente de base de datos distribuida (BDD)
13Tipos de DDBMs
- Clasificados según su grado de
- homogeneidad / heterogeneidad
- autonomÃa
- transparencia de la distribución
14Grado de homogeneidad
- Un DDBMS homogéneo se caracteriza principalmente
por la utilización del modelo descendente para la
conceptualización del diseño de la BD, en donde
la fragmentación vertical u horizontal de un
esquema global de datos determina la naturaleza
de cada uno de los componentes de la BDD
15- Un DDBMS heterogéneo se caracteriza por la
diversidad de DBMSs, modelos de diseño, sistemas
operativos, conceptualización del diseño y
hardware utilizado en cada uno de sus componentes
de BD
16- La heterogeneidad debida a diversos DBMSs es
común en organizaciones que crecen sin una
planeación en cuanto a sus sistemas de
información. - Dichos sistemas evolucionan paulatinamente en
diferentes DBMSs o diferentes modelos de
conceptualización, tales como jerárquico, de
red, relacional u orientado a objetos
17Tipos de heterogeneidad según Larson y Sheth
18Heterogeneidad semántica
- Ocurre cuando existe una diferencia en el
significado, interpretación o uso del mismo
modelo de datos
19Sistemas de Multibase de Datos
- MDBMS multi database management system
- También llamado Sistema de Base de Datos Federado
- Es un tipo de DDBMS
- Se compone de una colección de DBMS con alto
grado de autonomÃa
20MDBMS (cont.)
- Cada servidor es un DBMS centralizado
independiente y autónomo que tiene sus propios
usuarios locales, transacciones locales y
administrador de base de datos (DBA) - Por lo mismo, cada uno posee un alto grado de
autonomÃa local
21- En un MDBMS cada servidor puede autorizar el
acceso a porciones especÃficas de la BD
definiendo un esquema de exportación, el cual
especifica la parte de la BD a la cual puede
tener acceso una cierta parte de usuarios no
locales - Los MDBMS son catalogados como un sistema hÃbrido
entre los sistemas distribuidos y los
centralizados
22Grado de autonomÃa
- Es el grado de independencia de operación de cada
uno de los DBMS componentes del DDBMS
23AutonomÃa de diseño
- La capacidad de que cada Base de Datos Componente
(BDC) decida los aspectos concernientes con su
diseño. Es decir, las personas involucradas son
libres de decidir cualquier particularidad e
incluso decidir que DBMS usar.
24Aspectos a considerar en la autonomÃa de diseño
- El universo de datos relevante para el sistema
- La representación (modelo de datos, lenguaje de
consultas) y el nombrado de los datos - La conceptualización o interpretación semántica
de los datos (heterogeneidad semántica) - Restricciones usadas para administrar los datos
- La funcionalidad del sistema
- La asociación y compartición con otros sistemas y
- La implementación (p.e. registros y estructuras
de archivos).
25AutonomÃa de comunicación
- La habilidad de que una BDC decida comunicarse o
no con otro componente de una misma federación
26AutonomÃa de ejecución
- Es la habilidad de una BDC para ejecutar
operaciones locales sin la interferencia de
operaciones externas, en el orden que la BDC lo
decida
27AutonomÃa de asociación
- Cada BDC decide cuánto y cuándo puede compartir
su funcionalidad y recursos con otros
componentes, inclusive la capacidad de asociarse
o retirarse de una o más federaciones
28Grado de Transparencia de Distribución
- Si el usuario percibe un solo esquema integrado
sin información alguna relativa a la
fragmentación, replicación o distribución, se
dice que el DDBMS tiene un alto grado de
transparencia de distribución. - Si el usuario puede ver toda la fragmentación, el
reparto y la aplicación, el DDBMS no tiene
transparencia de distribución
29Distribución de los datos
30Fragmentación
- La fragmentación de una base de datos consiste en
descomponer en partes los datos, siguiendo algún
patrón conveniente y relacionado con la forma
como estos serán alimentados y explotados.
31Tipos de fragmentación
- Tipos primitivos de fragmentación
- Horizontal
- Vertical
- Tipos derivados
- Horizontal derivada
- Mixta
32Objetivos ideales
- Separar el concepto de fragmentación de los datos
del concepto de localización (o ubicación) de los
mismos. - Control explÃcito de la redundancia
- Independencia de DBMSs locales
33Tipos de transparencia
- Transparencia de fragmentación
- Transparencia de localización
- Transparencia de replicación
- Transparencia de correspondencia
34Niveles de transparencia
- 1. Transparencia de fragmentación
- 2. Transparencia de localización
- 3. Transparencia de correspondencia local
- 4. Sin transparencia