Title: Cap
1Capítulo 7 Construindo SAD orientado a dados e
documentos
- Como os gerentes acessam e usam grandes bancos de
dados de fatos históricos e externos?
2SAD orientado a dados
- Provêem o acesso e a manipulação de dados
históricos e, em alguns casos, de dados externos - Sistemas de arquivos simples que oferecem
facilidades para recuperação de dados, com
funcionalidades diversas - Armazém de dados trazem algumas funcionalidades
adicionais - Ferramentas OLAP
- SIE e GIS
3SAD orientado a documento
- Análise e recuperação de documento
- Um conjunto de docs relacionados e pouco
estruturados - Máquinas de busca, ferramentas de indexação e
sumarização - Gestão de doc e de conhecimento
4Comparação entre os dois tipos de SAD
- Dados estruturados vs. não estruturados
- Diferentes ferramentas de análise
- Armazenamento de dados e documentos
- Recuperação e indexação
- Atendimento de necessidades do usuário
- O que deve ser feito e quando???
54 subcategorias de SAD orientado a dados
- Armazéns de dados
- OLAP / BI
- SIE
- SAD espacial
6Armazéns de dados
- Orientado a assunto
- Foco nos aspectos de negócio ou no seu formato
organizacional (clientes, fornecedores, e
empregados) - Integrado
- Os dados são armazenados num formato consistente
com uso de padrões, áreas de domínio, atributos
físicos e valores - Considera da idade do dado
- Mantém a integridade do dado
- O dado não se altera enquanto estiver no armazém
de dados
7Um armazém de dados (teradata)
8OLAP - On-Line Analytical Processing
- Permite a criação de várias visões e
representações dos dados - BD multidimensional
- Captura e apresenta dados e conjuntos de dados
que são dimensionados com a ajuda de atributos
relevantes
9BD tridimensional - Cubo
10Agregação do dado ao SAD
11SIE (Executive Information System)
- Ênfase em dados gráficos
- Retira informação do BD corporativo
- Provê relatórios executivos para a alta gerência
- Foram inicialmente desenvolvidos sem ligação com
SAD
12SIE vs. SI
13SAD espacial
- Um sistema de suporte que manipula grandes
quantidades de mapas - Auxilia as pessoas a acessar, manusear e analisar
dados que possuam conteúdo geográfico - Exemplo análise de áreas com altos índices de
crimes, análise de distribuição geográfica de
clientes, análise de zonas eleitorais, etc
14SAD orientado a dados vs. BI
- BI é um termo guarda chuva usado para sistemas de
software que melhoram a tomada de decisão em
negócios com o uso de SAD orientado a dados
15Gerentes e SAD orientado a dados
- Gerentes esperam achar suas próprias respostas
para questões de negócios - Gerentes NÃO querem esperar por relatórios
financeiros ou de mercado preparados por
analistas que manipulam bases de dados - Gerentes são os clientes e defensores dos SAD
orientados a dados
16Dados de um SAD vs. Dados Operacionais
- Dados de um SAD são dados SOBRE transações e
ocorrências - Dados operacionais são registros de dados
específicos sobre uma dada transação de negócio - Estes dois tipos de dados diferem em cinco
dimensões Estrutura do Dado, Validade,
Sintetização, Volatilidade, e Dimensão
17Dados de um SAD vs. Dados Operacionais
- Estrutura do Dado
- Dados de um SAD
- Tabelas precisam ser agregadas para que uma
resposta seja obtida a uma query - Não inclui detalhes de uma transação
- Inclui uma síntese da transação
- Pode ter redundância na estrutura de dados se
isto refletirá em maior velocidade normalização
não é uma necessidade
18Dados de um SAD vs. Dados Operacionais
- Estrutura do Dado
- Dados Operacionais
- Software e hardware são otimizados para suportar
transações sobre as operações rotineiras - Armazenados em muitas tabelas
- Os dados armazenados representam informação sobre
uma transação específica -
19Dados de um SAD vs. Dados Operacionais
- Validade
- Dados de um SAD
- É uma visão sobre o dado operacional num dado
momento do tempo - Séries históricas do dado operacional
- Armazena múltiplas visões do dado operacional
- Dado Operacional
- É o estado atual de uma dada transação de negócio
20Dados de um SAD vs. Dados Operacionais
- Sintetização
- Dados de um SAD
- Sintetizado na Base de Dados
- Dado Operacional
- DETALHADO, não é sintetizado na tabela
21Dados de um SAD vs. Dados Operacionais
- Volatilidade
- Dados de um SAD
- Não são voláteis
- Dados Operacionais
- São voláteis, os dados são alterados dependendo
se uma nova transação ocorre
22Dados de um SAD vs. Dados Operacionais
- Dimensão
- Dados de um SAD
- Têm múltiplas dimensões
- Sempre referente ao ponto de vista de um gerente
ou de um analista - Dados Operacionais
- Têm uma única dimensão
23Metadados
- Dados sobre dados
- Provêem um diretório que apóiam o DB de um SAD
na localização de conteúdo em DW ou repositórios
de dados - Guias para localização de dados mapeando-os do
ambiente operacional para o ambiente do armazém
de dados
24Metadados
- Servem como guias para os algoritmos de
sintetização de dados detalhados - Informação semântica associada a uma dada
variável - Deve incluir definições de negócio associadas ao
dado, descrições de tipos de dados, potenciais
valores, a fonte original do sistema, formatos
de dados, e outras características
25Síntese das Diferenças
Fatores Dados Operacionais Dados de um SAD
Estrutura Dados normalizado integrado
Validade atual histórico
Síntese nenhuma extensiva em alguns sistemas
Volatilidade volátil não volátil
Dimensão Uma dimensão Múltiplas dimensões
Metadado desejável requerida
26Uma arquitetura interconectada
- Armazenamento de dados
- Uma ou mais bases de dados
- Componentes para extração de dados e filtros
- Query e relatórios
- Interface para análise dados e apresentação
27Arquitetura
28Implementação
- Resultados que devem ser alcançados
- O armazenamento de dados não é estático visões
temporais são adicionadas - Infra-estrutura de suporte a decisão inclui
hardware, software, pessoas e procedimentos - A estrutura para armazenamento de dado e a
implementação deve ser examinada no contexto de
toda a infra do DSS
29Implementação
- Aspectos técnicos
- Deve prover análises requeridas com desempenho
aceitável - Deve suportar as análises de dados requeridas
pelos tomadores de decisão - Web based, tempo real
30Processo de desenvolvimento
31Desenvolvimento de SAD orientado a documento
- Coleta inicial de dados ou diagnóstico
- Como os doc serão armazenados?
- Busca, recuperação, síntese e apresentação
- Como você agrega valor? Recuperar e apresentar
será suficiente? - Rastrear o histórico, achar padrões
32Alcançando sucesso
- Ache um projeto campeão
- Esteja informado sobre tecnologias
- Esteja informado acerca dos custos
- Invista em treinamento
- Divulgue o SAD
33Conclusão
- Diferentes tecnologias são necessárias para se
construir SAD usando dados estruturados e
documentos - SAD orientado a dados surgem de uma simples
verificação de fatos para uma análise de dados
mais sofisticada envolvendo grandes massas de
dados - SAD orientado a documentos representam mais uma
inovação
34Questões para revisão
- O que faz uma empresa demandar o uso de armazéns
de dados e OLAP? - Como os gerentes podem aumentar as chances de
sucesso de um SAD orientado a dados ou
documentos? - O que é um EIS (Executive Information Systems)?
- Porque a normalização não é necessária em SAD
orientado a dados?
35Exercício 01
- Excel Pivot Table Exercise
- The Pivot Table tool in Microsoft Excel has some
similarities to many OLAP tools. Create a small
table with 5 columns (time, shoe style, store,
price and quantity). Load some data into the
table and launch the Pivot Table tool. Place the
column dimensions in the Row, Column and Page
fields put the measures price and quantity in
the data area.
36Exercício 02
- Evaluate Data-Driven DSS Vendors. Critique and
evaluate a group of DSS vendor Web sites and read
their product information. Product categories and
vendor groups include OLAP/Multidimensional
database vendors, data mining, Executive
Information Systems, GDSS, Report and Query
tools, Geographic Information Systems. Check
Larry Greenberg's "Data Warehousing Information
Center" (http//www.dwinfocenter.org) Web site
and the DSSResources.COM Vendors
(http//dssresources.com/vendorlist/) Web page. - Questions you should try to answers include what
is the product category? what is the product used
for? how informative about the vendor's products
are the web sites ? which are the best web sites?
worst web sites? which products would you want to
test or learn more about?