Title: An
1Análisis Discriminante
2- Dos problemas principales de clasificación
- Discriminación (clasificación supervisada)
- Agrupamiento (Cluster Analysis) (clasificación no
supervisada)
3El problema estadístico de discriminación
- Dadas dos poblaciones de elementos con
distribución conocida clasificar un nuevo
elemento en una de las dos poblaciones
4Ejemplos
- Clasificar
- Restos de un cráneo como homínido o no
- Un solicitante de un crédito como solvente o no
- Un paciente con cáncer o no
- Una obra de arte al autor A o B.
- Diseño de máquinas de clasificación (para cartas,
billetes,monedas, etc.)
5Datos habituales
Elemento 1
Elemento 1
Elemento n2
Elemento n1
Grupo A Grupo B
6Análisis de genes
7Identificación de rasgos
.23 .
Identificar Rostro(pauta)
Matriz
Clasificar como conocido o no
8Problemas de clasificación
A
?
4
100 euros?
1000 dracmas?
9Planteamiento general
10(No Transcript)
11Costes
12(No Transcript)
13(No Transcript)
14(No Transcript)
15Caso particular Poblaciones normales
Tomando logaritmos, obtenemos la clasificación en
P2
16(No Transcript)
17Interpretación de la regla Simplificando lo que
es común en ambos miembros quedan solo términos
lineales en x
18(No Transcript)
19(No Transcript)
20Probab. de error y a posteriori
21(No Transcript)
22Interpretación
Clasificar en B
B
Clasificar en A
A
23(No Transcript)
24(No Transcript)
25(No Transcript)
26(No Transcript)
27(No Transcript)
28(No Transcript)
29(No Transcript)
30(No Transcript)
31(No Transcript)
32(No Transcript)
33Fisher
Clasificar en población B
Clasificar en A
B
A
34Enfoque de Fisher
35(No Transcript)
36Varios grupos
37(No Transcript)
38(No Transcript)
39(No Transcript)
40(No Transcript)
41(No Transcript)
42ejemplo
43(No Transcript)
44(No Transcript)
45(No Transcript)
46(No Transcript)
47(No Transcript)
48(No Transcript)
49Discriminación cuadrática
50(No Transcript)
51Clasificación logística
52(No Transcript)
53Problemas del modelo lineal
- No hay garantía de que las probabilidades estén
entre cero y uno, pueden tomar valores negativos
o mayores que uno. - Es heterocedástico.
- Si estimamos el modelo lineal con variable de
clasificación 1 1 se obtiene la función lineal
discriminante.
54(No Transcript)
55- Otros enfoques
- Redes neuronales
- Métodos no paramétricos
- Máquinas de vector soporte
56redes neuronales
Aproximar la función
mediante
57(No Transcript)
58(No Transcript)
59Máquinas de vector soporte