Clasificacin Automtica Anlisis Cluster - PowerPoint PPT Presentation

1 / 21
About This Presentation
Title:

Clasificacin Automtica Anlisis Cluster

Description:

Medida de la similaridad/disimilaridad de los datos. Proximidad o lejan a entre individuos ... No funciona bien si hay ruido y outliers. 2.2.2 Nubes Din micas ... – PowerPoint PPT presentation

Number of Views:215
Avg rating:3.0/5.0
Slides: 22
Provided by: livercent
Category:

less

Transcript and Presenter's Notes

Title: Clasificacin Automtica Anlisis Cluster


1
Clasificación Automática Análisis Cluster
  • Óliver Centeno Álvarez

2
Índice
  • Introducción
  • Clustering Numérico
  • Métodos Jerárquicos
  • Métodos No Jerárquicos
  • Clusters Solapados
  • Clustering Conceptual

3
1 Introducción
  • Propósito Agrupar objetos similares utilizando
    sus características
  • Conceptos
  • Matriz de proximidad nxn
  • Medida de la similaridad/disimilaridad de los
    datos
  • Proximidad o lejanía entre individuos
  • Cluster
  • Conjunto de objetos con cohesión interna y
    aislamiento externo

4
2 Clustering Numérico
  • 3 tipos básicos de procedimientos
  • Métodos Jerárquicos
  • Ascendentes ó Aglomerativos
  • Descendentes o Divisorios
  • Métodos No Jerárquicos
  • Basados en Particiones
  • Clusters Solapados
  • Otros Métodos
  • Basados en Densidades
  • Basados en Rejillas

5
2.1 Métodos Jerárquicos
  • Construyen una sucesión de particiones ?1, ?2, ,
    ?k encajadas con cada vez
  • Menos clases ? Ascendente
  • Más clases ? Descendente
  • Dendograma
  • Representación en forma de árbol
  • Se juntan las dos clases más próximas en cada
    paso y se crea un nuevo vértice
  • La altura del vértice representa la distancia

6
2.1.1 Métodos Jerárquicos Ascendentes
  • Comienza con tantas clases como individuos a
    clasificar ?1 1/ 2/ 3/ / n
  • Agrupo según la distancia entre individuos d(x,y)
    y la distancia entre clases d(A,B)
  • Se mide la distancia con Índice de Agregación
  • Salto mínimo, Diámetro, Promedio, Centroide
    (centro de gravedad), Mediana, Inercia (Ward),
  • Ejemplo 5 individuos con
  • d(1,3) 1 d(24,5) 4
  • d(2,4) 3 d(13,245) 6

7
2.1.1 Ejemplo
8
2.1.2 Métodos Jerárquicos Descendentes
  • Parten del conjunto de individuos y lo subdividen
    hasta ?n 1/ 2/ 3/ / n
  • En cada paso aparecen las 2 clases más separadas
  • Utiliza los mismos criterios que el ascendente
  • Ejemplo
  • d(13,245) 6
  • d(24,5) 4
  • d(2,4) 3
  • d(1,3) 1

9
2.2 Métodos No Jerárquicos
  • Objetivo Construir 1 partición del espacio en k
    clases diferentes
  • Algoritmos exhaustivos
  • Explosión combinatoria
  • Algoritmo de Centros Móviles (k-Means)
  • Reagrupación en torno a centros móviles
  • Nubes Dinámicas
  • Generalización de centros móviles

10
2.2.1 K-MEANS
  • Algoritmo de Forgy
  • Aplica el criterio de inercia o varianza
    ISpd²(x,g)
  • Paso 0 Se eligen k puntos de arranque (centros
    iniciales) g1, g2, ... gk
  • Paso 1 Se definen las clases de orden i1
  • Infi1...k d(x, gi) d(x, gr) ? Cr¹
  • Paso 2 Se calculan los nuevos centros de
    gravedad
  • Si la inercia se estabiliza FIN
  • Sino Ir a Paso 1

11
2.2.2 Ejemplo
12
2.2.3 Ventajas e Inconvenientes
  • Ventajas
  • Algoritmo sencillo con cálculos simples
  • Funciona bien para clusters esféricos
  • Inconvenientes
  • El resultado depende de la elección de K
  • Sólo a datos a los que se le pueda hacer la
    media.
  • No adecuado para clusters con formas convexas y
    de distintos tamaños
  • No funciona bien si hay ruido y outliers 

13
2.2.2 Nubes Dinámicas
  • Se eligen h varios puntos para cada clase
  • Estos constituyen el núcleo de la clase
  • Criterio de proximidad al núcleo
  • Mínd(x,N), Distancia del centro al núcleo,
    Distancia promedio a los puntos del núcleo,
  • Algoritmo de Forgy

14
2.3 Clusters Solapados
  • Combinan procedimientos jerárquicos y no
    jerárquicos
  • Estabilización por centros móviles
  • Aplicar centros móviles a las clases obtenidas
    por corte de un dendograma
  • Paso 1 Construir el dendograma
  • Paso 2 Cortar el árbol para obtener k clases
  • Paso 3 Aplicar k-Means a partir de los centros
    obtenidos
  • Clasificación mixta
  • Agrupar los individuos en muchas clases en torno
    a centros móviles (pero muchas menos que el nº de
    individuos)
  • Aplicar un algoritmo jerárquico a las clases
    obtenidas

15
3. Clustering Conpectual
  • Permite agrupar objetos en clases según los
    valores de los atributos
  • Cada clase queda caracterizada por un concepto
  • Se consideran las relaciones semánticas
  • Objetivo Introducir el máximo conocimiento del
    contexto

16
3.1 Cobweb
  • Árbol de clasificación
  • Cada nodo referencia un concepto y contiene las
    probabilidades de los atributos y la clase
  • Cada atributo puede tomar múltiples valores
  • Se incluyen instancias descendiendo por el árbol
    y guiándose por una medida de utilidad
  • Mayor utilidad cuanto mas similares sean los
    miembros de dos clases y más distintos sean a los
    del resto

17
(No Transcript)
18
3.3 Ejemplo Cobweb
  • Agrupar figuras geométricas según su forma, color
    y tamaño
  • - Forma Circulo, Cuadrado
  • - Color Rojo, Verde, Azul
  • - Tamaño Pequeño, Mediano, Grande
  • El primer ejemplo crea la raíz del árbol
  • Ej1Círculo, Rojo, Grande

19
3.3 Ejemplo Cobweb
  • Los siguiente ejemplos generan niveles sucesivos
  • Ej2 Cuadrado, Azul, Grande genera el 2º nivel
  • Ej3 Círculo, Rojo, Medio se incorpora a C1

20
3.3 Ejemplo Cobweb
  • Se elige como introducir el nuevo ejemplo
    comparando la utilidad entre
  • Incorporarlo a una de las clases existentes
  • Crear una nueva clase al mismo nivel
  • Fusionar o particionar 2 clases
  • Ej4 Cuadrado, Azul, Medio
  • Se incorpora a la clase 2

21
3.1 Ventajas e inconvenientes
  • Ventajas
  • Utiliza medida de utilidad de categoría para
    aprender
  • Define 4 operadores básicos para construir la
    jerarquía
  • Elige el operador en función de la medida
  • Inconvenientes
  • Suele haber correlación entre los atributos
  • Es costoso almacenar y actualizar si hay muchos
    valores
  • Árboles no balanceados ? Mayor complejidad
Write a Comment
User Comments (0)
About PowerShow.com