Title: Jos Ignacio Latorre
1 Data Mining y redes
neuronales para el
sector farmacéutico
Club de Marketing Barcelona Octubre 2001
José Ignacio Latorre UB http//sophia.ecm.ub.es/la
torre/
2Data Mining científico THE GRID
Detector del futuro LHC
online system multi-level trigger filter out
background reduce data volume
1 petabit/s
3Neural Networks for business
Lluís Garrido Sergio Gómez José Ignacio
Latorre Universitat de Barcelona http//quantium
.ecm.ub.es latorre_at_ecm.ub.es
QuantiuM
StockNN
QnnM
4Data Mining
5Data Mining una definición
Arte/Ciencia de extraer información útil, no
obvia de una gran base de datos
- Énfasis en
- no obvia (difícil)
- útil (coste vs beneficio)
- gran (automatización)
- No hay reglas siempre que el proceso
- sea eficiente en tiempo, espacio y recursos
humanos.
6Tres pasos
Preparación de datos
Análisis de datos
Redes neuronales
Toma de decisiones
7Preparación de datos
Extraer / Integrar datos Transformar Seleccionar L
impiar
Data warehouse
50-80 tiempo del proyecto
8Scrubbing, selecting, cleansing, preprocessing,
- Eliminar redundancia
- Eliminar datos irrelevantes
- Tratar datos ausentes
- media, substituciones astutas, interpolar,
ignorar, ? - Corrección de errores
- Outliers (datos fuera de rango)
- Verificar consistencia
- Reservar preprocesamiento relevante para la fase
de análisis
9Análisis de datos
- Técnica
- Árboles de decisión
- Reglas de asociación
- Regresiones
- Algoritmos genéticos
- Redes neuronales
-
- Tarea conceptual
- Clasificación
- Optimización
- Interpolación
- Modelización
- Predicción
-
- Objetivo
- Target marketing
- Market segmentation
- Process control
- Sales forecasting
- Market laws
-
Las redes neuronales son una herramienta de
análisis basada en aprendizaje mecánico de
ejemplos. Matemáticamente, implementan
inferencia bayesiana. Proporcionan modelos
no-lineales a partir de ejemplos.
10Toma de decisiones
(A menudo subestimada en la cultura del data
mining)
El análisis matemático puede parecer inescrutable
- El analista debe entender con profundidad el
problema - Los resultados deben presentarse honestamente
- Post-procesamiento e inclusión de factores
subjetivos - es a menudo esencial
- Una estricta validación del modelo es clave
11Por qué el Data Mining no es empleado por todo
el mundo?
- Por qué Office, Staroffice, Lotus,.. no incluyen
herramientas de - Data Mining?
- Una explotación naive o no competitiva produce
pérdidas - El sentido común y una buena preparación del
analista hace - rentables a una red neuronal high cost
- Estamos viviendo los primeros pasos de la Era de
la Información - en España
12Redes neuronales
13Un poquito de historia
1950-1960 dos estrategias para resolver problemas
top reglas sere boleano frágil experto down
top ejemplos paralelo difuso robusto general
down
1985 Aprendizaje por propagación de errores
14Qué es una red neuronal?
capa 1 capa 2 capa l .....
Red neuronal multicapa
15Para qué sirven las redes neuronales?
- Clasificación
- Clientes buenos/malos, propensión a comprar,
- Reconocimiento, divorcios, ...
- Interpolación, optimización
- Ej pintura, horno antibióticos, ...
- Predicción
- Ventas coches, temperaturas en BCN, bajas en
seguros, ... - Modelización
- Construir un modelo de predicción de propagación
de fuego
16Reconocimiento de formas
Una red neuronal ha sido entrenada para
reconocer la silueta de un avión militar La
red neuronal detecta un caza escondido bajo
un avión comercial
Belgrado 19/04/1999
17Estrategia
18Datos
- Política de recogida de datos
- Perfíl de pacientes
- Consumo, área geográfica, edad, poder adquisitivo
- Perfil de médico
- Edad, fidelidad, relación con visitante, hábitos
- Situación económica
- Opinión subjetiva, datos macroeconómicos
- Política de limpieza de datos
- Eliminación y actualización de errores
- Creación de un data warehouse
19Análisis
El análisis de los datos de la empresa puede
realizarse
Nivel interno control total del análisis
inversión en personal cualificado y
equipos Outsourcing solución económica y
experta información amenudo no relevante
(evitar consultorías)
20Propuesta
Creación de una agencia farmacéutica de Data
Mining
- A modo de agencia externa evaluación
- servicios colectivos individualizados
- Ejemplo existente servicios de evaluación de
riesgo financiero - http//www.risklab-madrid.uam.es/es/presenta
cion.html - Existen herramientas para garantizar
confidencialidad - (ejecución de programas locales descargados java
applets) - Financiación europea
- (min 3 empresas de dos países, programas IST,
CRAFT,...)
21IA
Política
Mercado
Empresa 1
Empresa 2
Empresa 3
Empresa 4
Datos integración limpieza
Data Mining clusterización
doctor/comercial targeted marketing
lanzamientos
Predicción Control
22Toma de decisiones
23(No Transcript)