Title: Unidad I Conceptos iniciales
1Unidad IConceptos iniciales
2Información y Datos
3Datos
Información
4Elemento que por sí solo es irrelevante como
conocimiento y como apoyo a la toma de
decisiones.
Por ejemploUn número telefónico, el nombre de
una persona.
-gtsin un propósito, una utilidad o un contexto no
sirven como base para apoyar la toma de una
decisión.
5La altura de una montañaLa fecha de nacimiento
de un personaje históricoEl peso especifico de
una sustanciaEl número de habitantes de un
paísetc.
6Pueden ser una colección de hechos almacenados
en algún lugar físicoun papelun dispositivo
electrónico (CD, DVD, disco duro...)o la mente
de una persona.
7En términos informáticos, un dato esuna
representación simbólica (numérica, alfabética,
etc.) de un atributo o característica de una
entidad
un número, una letra, un signo ortográfico u
otro símbolo que represente una cantidad, una
medida, una palabra o una descripción.
No tiene valor semántico (sentido) en sí mismo,
pero convenientemente tratado (procesado) se
puede utilizar en la realización de cálculos o
toma de decisiones.
8-gtSon la materia prima de la cual se deriva la
información.
Cantidad o hecho, sin analizar, que por sí solo
no tiene significado y debe ser presentado en
forma utilizable y colocado en un contexto que le
dé valor. Edad, número de artículos vendidos,
sueldo, etc.
9Cuantitativos. Se pueden contar o medir.
Expresan mediante números las propiedades de un
objeto, hecho o persona. Edad, peso, fecha de
transacción.
Tipos de datos.
Cualitativos.No se pueden contar, ni medir.
Expresan las características o propiedades de un
objeto, hecho o persona. Sexo, descripción de un
artículo, nombre.
10- No es un dato.
- Es un conjunto organizado de datos, que
constituyen un mensaje sobre un determinado ente
o fenómeno. - Si por ejemplo organizamos datos sobre un país
(número de habitantes, densidad de población,
nombre del presidente, etc.) y escribimos el
capítulo de un libro, podemos decir que ese
capítulo constituye información sobre ese país.
11- Conjunto de datos procesados.
- Tienen un significado (relevancia, propósito y
contexto) para el organismo u organización que
los percibe. - Son de utilidad para quién debe tomar decisiones,
al disminuir su incertidumbre. - Los datos se pueden transformar en información
añadiéndoles valor
12- Contextualizando se sabe en qué contexto y para
qué propósito se generaron. - Categorizando se conocen las unidades de medida
que ayudan a interpretarlos. - Calculando los datos pueden haber sido
procesados matemática o estadísticamente. - Corrigiendo se han eliminado errores e
inconsistencias. - Condensando los datos se han podido resumir de
forma más concisa.
13- Información Datos Contexto (añadir valor)
Utilidad (disminuir la incertidumbre)
14Cualidades de la información La creciente
necesidad de información y la mayor
disponibilidad de ésta pueden deteriorar su
calidad si no se toman las medidas necesarias
para evitarlo. Si pierde sus cualidades, lejos
de cumplir sus objetivos, es decir, aportar un
conocimiento, puede perder su valor informativo
siendo incluso perjudicial para los destinatarios
de la misma. ?
15Precisión Porcentaje de información correcta
sobre el total de información almacenada en el
sistema.
Oportunidad Tiempo transcurrido desde que se
produjo el hecho que originó el dato hasta el
momento en el que la información se pone a
disposición del usuario. Dependiente de la
finalidad de los datos. Para la elaboración de
un censo de población de varios millones de
datos, un tiempo de proceso de meses no le resta
oportunidad a la información. Esta demora en
otro tipo de valores como las cotizaciones en
bolsa sería inadmisible, despojando a los datos
de su valor informativo.
16?Completitud Ha de ser completa para cumplir los
fines para los que se gestiona. Si se mantiene
un sistema de información como sistema de apoyo a
la toma de decisiones, la información
proporcionada por éste ha de contener todos los
elementos informativos necesarios para dar apoyo
a la toma de decisiones.
?Significado El contenido semántico de los datos
ha de ser máximo. Más información no significa
mejor información, un volumen excesivo de
información dificulta su asimilación por parte
del usuario.
17?Integridad La información debe ser coherente en
sí misma, además de consistente con las
restricciones semánticas del mundo al que ha de
representar lo más fielmente posible.
?Seguridad Debe prestarse especial atención a la
protección de la información tanto frente a su
deterioro físico o lógico como a los accesos no
autorizados.
18- Definición de Base de Datos
- Necesidad mantener datos relacionados.
- Para qué?
- Para representar una realidad específica dentro
de alguna organización. - Para ello se debe modelar esta realidad
semánticamente con algún modelo adecuado. - Una vez implementado, es posible guardar los
datos, y manipularlos para que entreguen la
información requerida.
19- Ejemplo Un cliente puede tener varios pedidos,
pueden existir varios pedidos para un mismo
artículo, diferentes pedidos en diferentes
fechas, etc. - Si los requerimientos son
- Los pedidos del cliente X, una solución es
generar una lista por cada cliente, generando una
relación entre los archivos clientes y pedidos. - Todos los pedidos de un artículo, se tendrá una
lista por cada artículo, generando una relación
entre pedidos y artículo. - (Supongamos 3 archivos artículos, clientes y
pedidos) - Las relaciones anteriores son complejas, por lo
que se hace necesario contar con alguna
herramienta que facilite estos requerimientos.
20- Definición de base de datos
- "Colección de datos interrelacionados". (Elsmari
y Navathe, 1989). - "Conjunto de datos de la empresa memorizado en un
computador, que es utilizado por numerosas
personas y cuya organización está regida por un
modelo de datos". (Flory, 1982). - "Conjunto estructurado de datos registrados sobre
soportes accesibles por computador para
satisfacer simultáneamente a varios usuarios de
forma selectiva y en tiempo oportuno". (Delobel,
1982).
21- En la actualidad podemos establecer la definición
de base de datos - "Colección o depósito de datos integrados,
almacenados en soporte secundario (no volátil) y
con redundancia controlada. Los datos, que han de
ser compartidos por diferentes usuarios y
aplicaciones, deben mantenerse independientes de
ellos, y su definición (estructura de la base de
datos) única y almacenada junto con los datos, se
ha de apoyar en un modelo de datos, el cual ha de
permitir captar las interrelaciones y
restricciones existentes en el mundo real. Los
procedimientos de actualización y recuperación,
comunes y bien determinados, facilitarán la
seguridad del conjunto de los datos".
22Hay ciertas características que le son propias a
una BD
- El mundo real considera interrelaciones entre
datos y restricciones semánticas que deben estar
presentes en una base de datos. Una base de
datos no sólo debe almacenar entidades y
atributos, sino que también debe almacenar
interrelaciones entre datos.
23La redundancia de datos debe ser controlada, de
forma que no existan duplicidades perjudiciales
ni innecesarias. En las bases de datos NO está
permitida la redundancia lógica.
- Las bases de datos pretenden servir a toda la
organización, es decir a múltiples usuarios y a
diferentes aplicaciones.
24La actualización y recuperación de las bases de
datos debe realizarse mediante procesos bien
determinados, incluidos en el SGBD
procedimientos que han de estar diseñados de modo
que se mantenga la integridad, seguridad y
confidencialidad de la base.
25- La independencia Dato-Proceso
- Una de las principales ventajas es la
independencia entre los datos y los tratamientos
que se hacen de ellos. - Esto a diferencia de los sistemas orientados a
procesos - Datos sumamente dependientes de los programas.
- Datos se almacenan en archivos diseñados para una
determinada aplicación.
26- La variación de los procesos es mayor que la de
los datos que estos procesos manejan. - No siempre que un proceso cambia esto determina
cambios en los datos que ese proceso utiliza. - Datos dependientes de los procesos inadecuada.
27- Las organizaciones sufren cambios, de forma
(banco que cambia su imagen corporativa, que se
agreguen o eliminen funciones de atención a
público o de producción, reducción de personal,
etc.) o de fondo (cambios en la misión de la
organización, en los objetivos). - Cualquiera de estos cambios puede generar algún
cambio en los datos, o bien en los procesos. - Al ser estos altamente dependientes, un cambio en
los datos afectaría a algún proceso, y al revés.
28- El concepto de Base de Datos rescata aquella
dependencia y la radicaliza priorizando la
independencia de estos últimos - Un conjunto de datos modelando la organización,
sobre el cual se establecen los procesos que los
utilizan. - La definición y mantención de este estos datos es
independiente de los procedimientos de la
organización y los procesos que apoyan su
realización.
29- DBMS Objetivos y Aportes en una organización
- Una empresa de cajas de ahorros mantiene
información acerca de clientes y sus cuentas de
ahorros. Los datos se almacenan en archivos. Para
permitir a los usuarios manipularla, el sistema
tiene programas - Programa para efectuar cargos o abonos en una
cuenta. - Programa para añadir una cuenta nueva.
- Programa para calcular el saldo de una cuenta.
- Programa para generar las operaciones mensuales.
30- Estos programas se han escrito en respuesta a las
necesidades de la organización. Si las
necesidades se incrementan, se añaden nuevos
programas. - Supongamos que las cajas de ahorros pueden
ofrecer cuentas corrientes. - Se crean nuevos archivos con los datos de las
cuentas corrientes y puede ser necesario nuevos
programas para estas situaciones. - Se añaden más archivos y programas al sistema.
31- Antes de la llegada de los sistemas de gestión de
bases de datos (SGBDs), las organizaciones
normalmente han almacenado la información usando
sistemas como el visto. - Esto tiene una serie de inconvenientes
importantes
32- Redundancia e inconsistencia de datos.
- Los datos pueden estar duplicados
- La dirección y número de teléfono de un cliente
puede aparecer en un archivo (cuentas de ahorros)
y en otro archivo (cuenta corriente). - Redundancia almacenamiento y coste más altos.
- Inconsistencia de datos las copias de los mismos
datos pueden no coincidir. Un cambio en la
dirección del cliente puede estar reflejado en
los registros de las cuentas de ahorro pero no en
el resto del sistema.
33- Dificultad en el acceso a los datos.
- Se necesita averiguar los nombres de todos los
clientes que viven en el distrito postal 28733 de
la ciudad. - La petición no fue prevista no hay un programa
que la satisfaga. - Hay un programa que genera la lista de todos los
clientes. - Dos opciones obtener lista de todos los clientes
y obtener la información a mano, o pedir se haga
el programa necesario. - Ambas alternativas son obviamente
insatisfactorias.
34- Aislamiento de datos.
- Los archivos y programas son creados por
diferentes programadores, por ende diferentes
formatos y diferentes lenguajes. - Los datos están dispersos en varios archivos, y
los archivos pueden estar en diferentes formatos,
es difícil escribir nuevos programas para
recuperar los datos apropiados.
35- Problemas de integridad.
- Los valores de los datos de la base de datos
deben satisfacer ciertos tipos de restricciones
de consistencia. - El saldo de una cuenta bancaria no puede nunca
ser más bajo de una cantidad predeterminada (por
ejemplo 20.000). - Esas restricciones se añaden a través del código
apropiado en los diversos programas. - Cuando se añaden nuevas restricciones, es difícil
cambiar los programas para hacer que se cumplan. - El problema es complicado cuando las
restricciones implican diferentes elementos de
datos de diferentes archivos.
36- Problemas de atomicidad.
- Un computador está sujeto a fallo.
- Es crucial asegurar que, una vez que un fallo ha
ocurrido y se ha detectado, los datos se
restauran al estado de consistencia que existía
antes del fallo. - Transferir 50.000 desde la cuenta A a la B.
- Si ocurre un fallo del sistema es posible que la
plata se elimine de la cuenta A pero no sea
abonada a la cuenta B, resultando un estado de la
base de datos inconsistente. - La transferencia debe ser atómica ésta debe
ocurrir en ellos por completo o no ocurrir en
absoluto.
37- Anomalías en el acceso concurrente.
- Actualización de datos simultáneamente.
- Una cuenta A, contiene 500.000. Si dos clientes
retiran fondos (por ejemplo 50.000 y 100.000
respectivamente) de la cuenta A en
aproximadamente el mismo tiempo, el resultado de
las ejecuciones concurrentes puede dejar la
cuenta en un estado incorrecto (o inconsistente).
- Para protegerse contra esta posibilidad, el
sistema debe mantener alguna forma de
supervisión.
38- Problemas de seguridad.
- No todos los usuarios de un sistema de bases de
datos deberían poder acceder a todos los datos. - El personal de nóminas necesita ver sólo esa
parte de la base de datos que tiene información
acerca de varios empleados del banco. - No necesitan acceder a la información acerca de
las cuentas de clientes.
39- Ventajas de las bases de datos
40- Independencia entre datos y tratamientos. El
cambio en los programas no influye en los datos,
así como la modificación de éstos no afecta a la
reprogramación de las aplicaciones que los usan. - Coherencia de los resultados la información de
la base de datos se recoge y se almacena una sola
vez, luego en todos los tratamientos se utilizan
los mismos datos, y los resultados de estos son
coherentes y comparables. Se eliminan las
divergencias en los resultados.
41- Mejor disponibilidad de los datos para el
conjunto de los usuarios ningún usuario es
propietario de los datos, éstos se comparten
entre las aplicaciones, existiendo una mayor
disponibilidad y transparencia. - Mayor valor informativo El conjunto de los datos
almacenados en la BD ofrece un mayor valor
informativo, que la suma de ellos
independientemente. - Mejor y más normalizada documentación la mayoría
de los SGBD proporcionan herramientas para
reflejar el contenido semántico de los datos, es
decir, incluyen una descripción de los datos
dentro del sistema.
42- Reducción del espacio de almacenamiento La
desaparición (o disminución) de redundancias,
unido a las técnicas de compactación, implica una
menor ocupación de almacenamiento secundario. - El administrador puede asegurar que el único modo
de acceso sea a través de los canales
establecidos, y en consecuencia definir controles
de autorización que pueden afectar a cada modo de
acceso (modificación, inserción, borrado o
lectura).
43- Desventajas de las bases de datos
44Instalación costosa La implantación de un
sistema de base de datos puede implicar un coste
elevado, tanto en el equipo físico (adquisición
de nuevas instalaciones, o ampliaciones de las
existentes) como en el lógico (sistemas
operativos, programas, compiladores, etc.), así
como el coste de adquisición o mantenimiento del
SGBD.
- Implantación larga y difícil Debido a las causas
mencionadas anteriormente, la implantación de un
sistema de base de datos puede convertirse en una
tarea larga y complicada.
45Falta de rentabilidad a corto plazo Los amplios
costes que conlleva la implantación, implica una
rentabilidad no a corto, sino a medio, o incluso
largo plazo.
- Personal especializado es clave la
administración de la base de datos, se requiere
de conocimientos específicos.
- Resistencia al cambio sobre todo que este
involucra a toda la organización.
46Trabajo Investigación Usos de las bases de datos en la empresa. Objetivos y aportes. Objetivos del uso. Para qué Cómo Qué (datos utilizados) Herramientas utilizadas
Grupos. Trabajos y disertaciones definir fecha
47Componentes básicos de BD-R
- Requerimientos y necesidades
48- Una BD contiene los datos de una organización,
que se manipulan de la forma que ésta estime. - Modelar la realidad de ésta
- -gtestudio o análisis de requerimientos y
necesidades, e.d., cómo funciona, y qué
resultados desea obtener. - Etapa del diseño de Bases de datos. (ver
diagrama) - Los requisitos de datos son una entrada al diseño
conceptual. - Un mal análisis de requerimientos puede llevar a
un mal diseño, y por ende el resultado como
producto no será el esperado.
49(No Transcript)
50- Qué es un Requerimiento ?
- Condición o capacidad que el sistema debe
cumplir - Una capacidad del software necesaria para
resolver un problema o alcanzar un objetivo. - Una capacidad del software que debe ser reunida o
poseída por un sistema o componente para
satisfacer un contrato, especificación, estándar,
u otra documentación formal. - El rol clave de los requerimientos es mostrar a
los desarrolladores y usuarios qué se necesita de
un sistema.
51- Análisis de Requisitos.
- Qué representar?
- -gtelaborar un esquema descriptivo del mundo real.
- Se recoge y analiza los requerimientos de los
usuarios y de las áreas de aplicación estudio de
reglas de la empresa (del negocio). - Cómo?
- Entrevistando el personal, expertos en la área.
- Observando el funcionamiento de la empresa.
- Examinando documentos sobre todo aquellos que se
utilizan para recoger o visualizar la
información. - Utilizando cuestionario para recoger información.
- Utilizando la experiencia adquirida en el Diseño
de Sistemas similares.
52- Los problemas que presenta esta especificación,
se irán refinando hasta obtener el esquema
conceptual. - Esta etapa tiene como resultado un conjunto de
documentos con las especificaciones de requisitos.
53- Diseño Conceptual.
- Cómo representar?
- Objetivo obtener una buena representación de los
recursos de información de la empresa (el mundo
real). - Entrada especificación de requerimientos.
- Resultado esquema conceptual de la base de
datos, descripción de alto nivel de la estructura
de la base de datos, independiente del software
que se use para manipularla. - Modelos Conceptuales MER, Modelos OO, Formalismo
Individual.
54- Diseño Lógico.
- Objetivo transformar esquema conceptual,
adaptándolo al modelo de datos en el que se apoya
el SGBD que se va a utilizar (modelo relacional).
- Entrada esquema conceptual
- Resultado esquema lógico, que es una descripción
de la estructura de la base de datos que puede
procesar el software DBMS. - Modelos Lógicos Relacional, de Redes,
Jerárquico.
55- Diseño Físico.
- Objetivo conseguir una instrumentación lo más
eficiente posible del esquema lógico. - Entrada esquema lógico.
- Resultado esquema físico, que es una descripción
de la implementación de una base de datos en la
memoria secundaria, describe las estructuras de
almacenamiento y los métodos usados para tener un
acceso efectivo a los datos.
56- Causas de malos diseños
- Falta de conocimiento del dominio de la
aplicación, conocimiento que no posee el
informático, pero si el usuario (aunque no sepa
estructurarlo ni expresarlo de forma precisa). - Falta de experiencia en el modelado.