Minera de Datos - PowerPoint PPT Presentation

1 / 26

About This Presentation

Title:

Minera de Datos

Description:

El prop sito es buscar patrones interesantes en los datos. ... dicho preprocesamiento contiene un filtro de informaci n, es decir, s lo ... – PowerPoint PPT presentation

Number of Views:204

Avg rating:3.0/5.0

Slides: 27

Provided by: juancarlos3

Category:

more less

Transcript and Presenter's Notes

Title: Minera de Datos

1
Minería de Datos

M.C. Juan Carlos Olivares Rojas

2
Agenda

Introducción
El proceso de extracción del conocimiento
Algoritmos utilizados en el proceso de minería de
datos
Ejemplos

3
Introducción

Se define como un análisis de datos exploratorio.
El propósito es buscar patrones interesantes en
los datos. Se aplican muchas técnicas
estadísticas para buscar estos patrones.
Se pretende buscar reglas de asociación entre las
dimensiones de una tabla.

4
Introducción

Al conjunto de todas las transacciones se le
llama población.
Cualquier regla de asociación tiene un nivel de
soporte y uno de confianza.
Soporte es el fragmento de la población que
satisface la regla.

5
Introducción

El soporte es la fracción de la población, en la
cual se cumple el antecedente, también se cumple
el consecuente.
Se pueden encontrar en otro tipo de patrones Si
un cliente compra zapatos es probable que compre
calcetines no necesariamente en la misma
transacción.

6
El proceso de extracción del conocimiento

Para la extracción del conocimiento se tiene que
hacer un preprocesado de los datos. Generalmente
dicho preprocesamiento contiene un filtro de
información, es decir, sólo se tienen los campos
y datos para nuestro almacén de datos.
Este es un proceso único dependiente del problema
a resolver.

7
Algoritmos utilizados en el proceso de minería de
datos

Existen una gran infinidad de algoritmos
generalmente clasificados en dos tipos
estadístico y probabilísticos.
Los estadísticos funcionan con los datos de
nuestra tabla de hechos y deben devolver un
resultado expresado en probabilidad o no
obtenible mediante expresiones SQL básicas.

8
Algoritmos utilizados en el proceso de minería de
datos

El algoritmo mejor conocido es el de reglas de
asociación que encuentra dependencia entre
elementos, pero existen otros algoritmos como los
de agrupamiento (clustering) como los vecinos más
cercanos o k-means que encuentran relaciones
entre grupos de objetos con ciertas afinidades.

9
Algoritmos utilizados en el proceso de minería de
datos

Los algoritmos probabilísticos se encuentran con
técnicas en la mayoría de los casos más
avanzadas, como son las redes bayesianas, las
máquinas de soporte vectorial entre otros.
Los resultados de la minería de datos pueden
diferir según la técnica empleada aunque los
datos sean los mismos.

10
Weblog Mining

La Minería Web es simplemente aprovechar las
técnicas de Minería de Datos para obtener
conocimiento de la información disponible en
Internet.
Algunas áreas de aplicación
Mejorar el diseño de la estructura de un sitio
Web.

11
Weblog Mining

Planear campañas de marketing orientadas al
comercio electrónico.
Mejorar sistemas, ya sea en la calidad del
desempeño o la seguridad.
Identificar patrones de acceso a recursos Web con
el objetivo de seleccionar archivos para el
acaparamiento en dispositivos inalámbricos.

12
Weblog Mining
13
Weblog Mining
Bitácora a nivel de contenido
14
Weblog Mining
15
Weblog Mining
16
Weblog Mining
Fase 2. Identificación de Sesiones
Base de Datos Repositorio
Identificación del formato de la bitácora
Limpieza de bitácoras
Fase 1. Recolección y Pre-procesamiento
Fase 3. Minería de Datos
Fase 4. Recolección de estructuras
Fase 5. Análisis gráfico de los resultados
Fase 6. Aplicación del conocimiento
17
Weblog Mining

Una vez que se tienen objetos minables, la gama
de métodos para descubrir patrones va desde el
simple análisis estadístico hasta métodos
complejos como algoritmos de minería de datos.
Para este trabajo se implementó el algoritmo de
minería de reglas de asociación A-priori e ítems
frecuentes.

18
Weblog Mining
19
Weblog Mining
Esquema de almacenamiento de bitácoras
Esquema de almacenamiento de reglas
20
Weblog Mining
Carga de estructuras de sitios Web
Un grafo recortado
Estructura de un sitio Web
21
Weblog Mining
cenidet.edu.mx Agosto 2004
22
Clustering
23
Clustering
d(yi, Cj) (yi - Cj)T (yi - Cj) ?d l1 (yli
Clj)2 d(y1 c1) (y1 c1)T(y1 c1)
?2l1(yl1,cl1) (y11 C11)2 (y21 C21)2
24
Referencias

Date C. (2001), Introducción a los sistemas de
base de datos, 7a. Edición, Pearson educación,
México, 2001, ISBN 968-444-419-2, pp. 709-725.
Hernández, G. (2005) Generador de patrones de
navegación de usuario aplicando Web Log Mining en
cliente/servidor, Tesis de Maestría, CENIDET
2005.

25
Referencias