Title: Grupo de investigacin en
1- Grupo de investigación en
- Bases de Datos y Sistemas de Información
Inteligentes - Departamento de Ciencias de la Computación e
Inteligencia Artificial - ETS Ingeniería Informática - Universidad de
Granada
2TMinerData Mining en Java
3TMinerModelo conceptual
4TMinerInterfaz Windows
Los trabajadores del conocimiento pueden
analizar sus propios datos utilizando un interfaz
estándar de tipo WIMP...
5TMinerInterfaz Web
6TMinerSistema de ayuda en línea
TMiner ofrece unainterfaz bilingüe(español e
inglés) con un sistema de ayuda en líneaen
formato HTML
7TMinerMonitorización
Siempre podemos verel uso de memoria de la
aplicación TMiner
8TMinerInfraestructura
Component-based data mining frameworks OLAP vs.
OLTP in the middle tier Fernando Berzal, Ignacio
Blanco, Juan Carlos Cubero Nicolás
Marín Communications of the ACM, December 2002
9TMinerSelección de los datos
10TMinerSelección de los datos
Mediante el controlador JDBC adecuado se accede a
la base de datos
11TMinerSelección de los datos
Con TMiner podemos analizar cualquiera de los
conjuntos de datosde la base de datos
12TMinerEl conjunto de datos
13TMinerEl conjunto de datos
Una vez seleccionado el conjunto de datos,
podemos empezar a trabajar con él
14TMinerEl conjunto de datos
TMinerpermite realizarconsultas SQL
15TMinerEl conjunto de datos
Importar datos desde ficheros
16TMinerEl conjunto de datos
o exportar los datos de la base de datos
17TMinerPreparación de los datos
18TMinerPreparación de los datos
Una vez seleccionado el conjunto de datos,
podemos aplicar distintas técnicas de Data Mining
19TMinerPreparación de los datos
En primer lugar, seleccionamos las columnas del
conjunto de datos con las que vamos a trabajar
20TMinerPreparación de los datos
A continuación, agrupamos los valores de cada
atributo en función de cómo queramos
interpretarlos
21TMinerPreparación de los datos
Cuando los atributos son de tipo numérico,
podemos utilizar distintas técnicas de
discretización
22TMinerPreparación de los datos
Incluso se pueden asignar etiquetas
descriptivasa los conjuntos en que agrupamos los
valores de los atributos
23TMinerTécnicas de Data Mining
24TMinerTécnicas de Data Mining
Ya sólo nos quedaelegir qué algoritmos utilizar,
indicar valores adecuadospara sus parámetros y
esperar a ver los resultados que se obtienen
25TMinerTécnicas de Data Mining
26TMinerÁrboles de decisión
AlgoritmosID3, C4.5
27TMinerListas de decisión
Metodología STAR Algoritmos AQ y CN2
28TMinerReglas de asociación
Algoritmos Apriori y TBAR
29TMinerReglas de asociación
Clasificacióncon reglas de asociación
30Técnicas disponibles
- Extracción de reglas de asociación (TBAR)
- Modelos de clasificación
- Árboles de decisión
- ART
- Listas de decisión y algoritmos STAR (AQ CN2)
- Clasificadores paramétricos y no paramétricos
- e.g. Clasificadores euclídeos y cuadráticos,
k-NN, LVQ, DSM... - Algoritmos de agrupamiento clustering
- e.g. K-Medias, GRASP, ISODATA...
31TMinerAnálizador Numérico
32Analizador Numérico
Técnicas de clasificación y agrupamiento
El Analizador Numérico es la parte de TMiner
encargada de trabajar con números
33Analizador Numérico
Técnicas de clasificación y agrupamiento
Incluye técnicas de edición y condensado de
datos, distintos métodos de construcción de
clasificadores y múltiples algoritmos de
agrupamiento
34Analizador Numérico
Técnicas de clasificación y agrupamiento
Visualización de conjuntos de datos, estadísticas
y distribuciones de clases
35Analizador Numérico
Técnicas de clasificación y agrupamiento
Estadísticas por clases
36Analizador Numérico
Técnicas de clasificación y agrupamiento
37Analizador Numérico
Técnicas de clasificación y agrupamiento
Clasificadores paramétricos (lineales y
cuadráticos)
38Analizador Numérico
Técnicas de clasificación y agrupamiento
Clasificadores no paramétricos k-NN
39Analizador Numérico
Técnicas de clasificación y agrupamiento
Aprendizaje adaptativo LVQ y DSM
40Analizador Numérico
Técnicas de clasificación y agrupamiento
Métodos de agrupamiento K-MEANS, GRASP, ISODATA
41Clasificacióncon árboles de decisión
- Reglas de división
- Entropía
- Ganancia de información
- Índice de Gini
- MaxDif
- Ramas else
- Árboles n-arios
- con atributos numéricos
42Clasificación con ART
ART
TDIDT
ART A hybrid classification method Fernando
Berzal, Juan Carlos Cubero, Daniel Sánchez José
María Serrano Machine Learning, 2004
43Clasificación con ART
44Extracción de reglas de asociación
TBAR efficient method for association rule
mining in relational databases Fernando Berzal,
Juan Carlos Cubero, Nicolás Marín José María
Serrano Data Knowledge Engineering, 37 (2001),
47-64
45Más información...
Fernando Berzal Galiano fberzal_at_decsai.ugr.es Jua
n Carlos Cubero Talavera jc.cubero_at_decsai.ugr.es