Jos Ignacio Latorre - PowerPoint PPT Presentation

1 / 23
About This Presentation
Title:

Jos Ignacio Latorre

Description:

No hay reglas siempre que el proceso. sea eficiente en tiempo, espacio y recursos humanos. ... Verificar consistencia. Reservar preprocesamiento relevante para la fase de an lisis ... – PowerPoint PPT presentation

Number of Views:55
Avg rating:3.0/5.0
Slides: 24
Provided by: sophia6
Category:

less

Transcript and Presenter's Notes

Title: Jos Ignacio Latorre


1
Data Mining y redes
neuronales para el
sector farmacéutico
Club de Marketing Barcelona Octubre 2001
José Ignacio Latorre UB http//sophia.ecm.ub.es/la
torre/
2
Data Mining científico THE GRID
Detector del futuro LHC
online system multi-level trigger filter out
background reduce data volume
1 petabit/s
3
Neural Networks for business
Lluís Garrido Sergio Gómez José Ignacio
Latorre Universitat de Barcelona http//quantium
.ecm.ub.es latorre_at_ecm.ub.es
QuantiuM
StockNN
QnnM
4
Data Mining
5
Data Mining una definición
Arte/Ciencia de extraer información útil, no
obvia de una gran base de datos
  • Énfasis en
  • no obvia (difícil)
  • útil (coste vs beneficio)
  • gran (automatización)
  • No hay reglas siempre que el proceso
  • sea eficiente en tiempo, espacio y recursos
    humanos.

6
Tres pasos
Preparación de datos
Análisis de datos
Redes neuronales
Toma de decisiones
7
Preparación de datos
Extraer / Integrar datos Transformar Seleccionar L
impiar
Data warehouse
50-80 tiempo del proyecto
8
Scrubbing, selecting, cleansing, preprocessing,
  • Eliminar redundancia
  • Eliminar datos irrelevantes
  • Tratar datos ausentes
  • media, substituciones astutas, interpolar,
    ignorar, ?
  • Corrección de errores
  • Outliers (datos fuera de rango)
  • Verificar consistencia
  • Reservar preprocesamiento relevante para la fase
    de análisis

9
Análisis de datos
  • Técnica
  • Árboles de decisión
  • Reglas de asociación
  • Regresiones
  • Algoritmos genéticos
  • Redes neuronales
  • Tarea conceptual
  • Clasificación
  • Optimización
  • Interpolación
  • Modelización
  • Predicción
  • Objetivo
  • Target marketing
  • Market segmentation
  • Process control
  • Sales forecasting
  • Market laws

Las redes neuronales son una herramienta de
análisis basada en aprendizaje mecánico de
ejemplos. Matemáticamente, implementan
inferencia bayesiana. Proporcionan modelos
no-lineales a partir de ejemplos.
10
Toma de decisiones
(A menudo subestimada en la cultura del data
mining)
El análisis matemático puede parecer inescrutable
  • El analista debe entender con profundidad el
    problema
  • Los resultados deben presentarse honestamente
  • Post-procesamiento e inclusión de factores
    subjetivos
  • es a menudo esencial
  • Una estricta validación del modelo es clave

11
Por qué el Data Mining no es empleado por todo
el mundo?
  • Por qué Office, Staroffice, Lotus,.. no incluyen
    herramientas de
  • Data Mining?
  • Una explotación naive o no competitiva produce
    pérdidas
  • El sentido común y una buena preparación del
    analista hace
  • rentables a una red neuronal high cost
  • Estamos viviendo los primeros pasos de la Era de
    la Información
  • en España

12
Redes neuronales
13
Un poquito de historia
1950-1960 dos estrategias para resolver problemas
top reglas sere boleano frágil experto down
top ejemplos paralelo difuso robusto general
down
1985 Aprendizaje por propagación de errores
14
Qué es una red neuronal?
capa 1 capa 2 capa l .....
Red neuronal multicapa
15
Para qué sirven las redes neuronales?
  • Clasificación
  • Clientes buenos/malos, propensión a comprar,
  • Reconocimiento, divorcios, ...
  • Interpolación, optimización
  • Ej pintura, horno antibióticos, ...
  • Predicción
  • Ventas coches, temperaturas en BCN, bajas en
    seguros, ...
  • Modelización
  • Construir un modelo de predicción de propagación
    de fuego

16
Reconocimiento de formas
Una red neuronal ha sido entrenada para
reconocer la silueta de un avión militar La
red neuronal detecta un caza escondido bajo
un avión comercial
Belgrado 19/04/1999
17
Estrategia
18
Datos
  • Política de recogida de datos
  • Perfíl de pacientes
  • Consumo, área geográfica, edad, poder adquisitivo
  • Perfil de médico
  • Edad, fidelidad, relación con visitante, hábitos
  • Situación económica
  • Opinión subjetiva, datos macroeconómicos
  • Política de limpieza de datos
  • Eliminación y actualización de errores
  • Creación de un data warehouse

19
Análisis
El análisis de los datos de la empresa puede
realizarse
Nivel interno control total del análisis
inversión en personal cualificado y
equipos Outsourcing solución económica y
experta información amenudo no relevante
(evitar consultorías)
20
Propuesta
Creación de una agencia farmacéutica de Data
Mining
  • A modo de agencia externa evaluación
  • servicios colectivos individualizados
  • Ejemplo existente servicios de evaluación de
    riesgo financiero
  • http//www.risklab-madrid.uam.es/es/presenta
    cion.html
  • Existen herramientas para garantizar
    confidencialidad
  • (ejecución de programas locales descargados java
    applets)
  • Financiación europea
  • (min 3 empresas de dos países, programas IST,
    CRAFT,...)

21
IA
Política
Mercado
Empresa 1
Empresa 2
Empresa 3
Empresa 4
Datos integración limpieza
Data Mining clusterización
doctor/comercial targeted marketing
lanzamientos
Predicción Control
22
Toma de decisiones
23
(No Transcript)
Write a Comment
User Comments (0)
About PowerShow.com