Grupo de investigacin en - PowerPoint PPT Presentation

1 / 37
About This Presentation
Title:

Grupo de investigacin en

Description:

Departamento de Ciencias de la Computaci n e Inteligencia Artificial ... 'Component-based data mining frameworks: OLAP vs. OLTP in the middle tier' ... – PowerPoint PPT presentation

Number of Views:62
Avg rating:3.0/5.0
Slides: 38
Provided by: fernand66
Category:

less

Transcript and Presenter's Notes

Title: Grupo de investigacin en


1
  • Grupo de investigación en
  • Bases de Datos y Sistemas de Información
    Inteligentes
  • Departamento de Ciencias de la Computación e
    Inteligencia Artificial
  • ETS Ingeniería Informática - Universidad de
    Granada

2
TMinerData Mining en Java
3
TMinerModelo conceptual
4
TMinerInterfaz Windows
Los trabajadores del conocimiento pueden
analizar sus propios datos utilizando un interfaz
estándar de tipo WIMP...
5
TMinerInterfaz Web
6
TMinerSistema de ayuda en línea
TMiner ofrece unainterfaz bilingüe(español e
inglés) con un sistema de ayuda en líneaen
formato HTML
7
TMinerMonitorización
Siempre podemos verel uso de memoria de la
aplicación TMiner
8
TMinerInfraestructura
Component-based data mining frameworks OLAP vs.
OLTP in the middle tier Fernando Berzal, Ignacio
Blanco, Juan Carlos Cubero Nicolás
Marín Communications of the ACM, December 2002
9
TMinerSelección de los datos
10
TMinerSelección de los datos
Mediante el controlador JDBC adecuado se accede a
la base de datos
11
TMinerSelección de los datos
Con TMiner podemos analizar cualquiera de los
conjuntos de datosde la base de datos
12
TMinerEl conjunto de datos
13
TMinerEl conjunto de datos
Una vez seleccionado el conjunto de datos,
podemos empezar a trabajar con él
14
TMinerEl conjunto de datos
TMinerpermite realizarconsultas SQL
15
TMinerEl conjunto de datos
Importar datos desde ficheros
16
TMinerEl conjunto de datos
o exportar los datos de la base de datos
17
TMinerPreparación de los datos
18
TMinerPreparación de los datos
Una vez seleccionado el conjunto de datos,
podemos aplicar distintas técnicas de Data Mining
19
TMinerPreparación de los datos
En primer lugar, seleccionamos las columnas del
conjunto de datos con las que vamos a trabajar
20
TMinerPreparación de los datos
A continuación, agrupamos los valores de cada
atributo en función de cómo queramos
interpretarlos
21
TMinerPreparación de los datos
Cuando los atributos son de tipo numérico,
podemos utilizar distintas técnicas de
discretización
22
TMinerPreparación de los datos
Incluso se pueden asignar etiquetas
descriptivasa los conjuntos en que agrupamos los
valores de los atributos
23
TMinerTécnicas de Data Mining
24
TMinerTécnicas de Data Mining
Ya sólo nos quedaelegir qué algoritmos utilizar,
indicar valores adecuadospara sus parámetros y
esperar a ver los resultados que se obtienen
25
TMinerTécnicas de Data Mining
26
TMinerÁrboles de decisión
AlgoritmosID3, C4.5
27
TMinerListas de decisión
Metodología STAR Algoritmos AQ y CN2
28
TMinerReglas de asociación
Algoritmos Apriori y TBAR
29
TMinerReglas de asociación
Clasificacióncon reglas de asociación
30
Técnicas disponibles
  • Extracción de reglas de asociación (TBAR)
  • Modelos de clasificación
  • Árboles de decisión
  • ART
  • Listas de decisión y algoritmos STAR (AQ CN2)
  • Clasificadores paramétricos y no paramétricos
  • e.g. Clasificadores euclídeos y cuadráticos,
    k-NN, LVQ, DSM...
  • Algoritmos de agrupamiento clustering
  • e.g. K-Medias, GRASP, ISODATA...

31
TMinerAnálizador Numérico
32
Analizador Numérico
Técnicas de clasificación y agrupamiento
El Analizador Numérico es la parte de TMiner
encargada de trabajar con números
33
Analizador Numérico
Técnicas de clasificación y agrupamiento
Incluye técnicas de edición y condensado de
datos, distintos métodos de construcción de
clasificadores y múltiples algoritmos de
agrupamiento
34
Analizador Numérico
Técnicas de clasificación y agrupamiento
Visualización de conjuntos de datos, estadísticas
y distribuciones de clases
35
Analizador Numérico
Técnicas de clasificación y agrupamiento
Estadísticas por clases
36
Analizador Numérico
Técnicas de clasificación y agrupamiento
37
Analizador Numérico
Técnicas de clasificación y agrupamiento
Clasificadores paramétricos (lineales y
cuadráticos)
38
Analizador Numérico
Técnicas de clasificación y agrupamiento
Clasificadores no paramétricos k-NN
39
Analizador Numérico
Técnicas de clasificación y agrupamiento
Aprendizaje adaptativo LVQ y DSM
40
Analizador Numérico
Técnicas de clasificación y agrupamiento
Métodos de agrupamiento K-MEANS, GRASP, ISODATA
41
Clasificacióncon árboles de decisión
  • Reglas de división
  • Entropía
  • Ganancia de información
  • Índice de Gini
  • MaxDif
  • Ramas else
  • Árboles n-arios
  • con atributos numéricos

42
Clasificación con ART
ART
TDIDT
ART A hybrid classification method Fernando
Berzal, Juan Carlos Cubero, Daniel Sánchez José
María Serrano Machine Learning, 2004
43
Clasificación con ART
44
Extracción de reglas de asociación
TBAR efficient method for association rule
mining in relational databases Fernando Berzal,
Juan Carlos Cubero, Nicolás Marín José María
Serrano Data Knowledge Engineering, 37 (2001),
47-64
45
Más información...
Fernando Berzal Galiano fberzal_at_decsai.ugr.es Jua
n Carlos Cubero Talavera jc.cubero_at_decsai.ugr.es
Write a Comment
User Comments (0)
About PowerShow.com