Title: Diapositiva 1
1SEMINARIO DE POSGRADO
METODOLOGÍA DE INVESTIGACIÓN MÓDULO 6 TÉCNICAS
ESTADÍSTICAS DE ANÁLISIS MULTIVARIADO
2Métodos multivariados
Su clasificación
La investigación EMPÍRICA se ocupa de fenómenos
multidimensionales
- Problemas de interdependencia o creación de
índices (análisis factorial, cluster y
escalamiento). - Problemas de causalidad o asociación (análisis
de varianza, regresión y discriminante).
Clasificación de los métodos multivariados
3Métodos multivariados
Métodos de interdependencia
- Descripción de Dimensiones posibilitan la
identificación de dimensiones o conceptos
complejos subyacentes (Análisis Factorial,
Componentes Múltiples, etc.). - Clasificación de unidades o variables
permiten clasificar unidades individuales o
colectivas o variables con el fin de crear
tipologías, cluster o clases de individuos
(Cluster, Escalamiento, etc.).
4Métodos multivariados
Métodos de interdependencia
- Utilidad de este tipo de métodos
- Evalúan correlaciones y sintetiza información
- Muestran la estructura de los datos según
criterio - Establecen clasificaciones y/o genera valores
índices
- Técnicas de Análisis
- ANÁLISIS FACTORIAL
- ANÁLISIS DE CORRESPONDENCIAS
- ANÁLISIS DE CLUSTER
5Análisis factorial
- Busca una síntesis del fenómeno objeto de
estudio. Logra resumir la información e
identificar lo fundamental de la misma, revelando
la estructura subyacente de los datos. - Algunos ejemplos
- Identificar los factores o componentes
principales que intervienen en la construcción de
la imagen de una marca o de una organización, de
un comportamiento o de una actitud.
ANÁLISIS DE CASOS
6Análisis factorial
EN LA INVESTIGACIÓN SOCIAL SE TRABAJA CON MUCHOS
CONCEPTOS COMPLEJOS QUE NO SON DIRECTAMENTE
OBSERVABLES
USOS MÁS FRECUENTES
Creación de variables resumen
Identificación de estructuras subyacentes
7Análisis factorial
REQUISITOS PARA SU UTILIZACIÓN
- Selección de variables que formen conjuntos
coherentes (FACTORES) - Variables en escala métrica
- Variables no métricas (ESTADARIZACIÓN DE SUS
VALORES) - CANTIDAD DE CASOS mínimo de 100 casos
- CIERTA CORRELACIONES ENTRE LAS VARIABLES
OBSERVABLES
8Análisis factorial
ETAPAS BÁSICAS
- FASE DE PREPARACIÓN DE VARIABLES. ANÁLISIS DE
CORRELACIÓN. - MÉTODO DE COMPONENTES. EXTRACCIÓN Y SELECCIÓN DE
LOS FACTORES. - GRÁFICO DE SEGMENTACIÓN. VALORES PROPIOS Y
VARIANZA EXPLICADA. MATRIZ DE CARGAS FACTORIALES.
- INTERPRETACIÓN ROTACIÓN VARIMAX Y REPRESENTACIÓN
GRÁFICA - EVALUACIÓN Y VALORACIÓN DEL ANÁLISIS
9(No Transcript)
10(No Transcript)
11Análisis de Componentes Principales
Caracterización de los factores Saturaciones
Factor 1 Acceso deficitario a la educación y la
vivienda
12Análisis de Componentes Principales
Extracción de los factores principales
13Análisis de correspondencia
- Busca descubrir y describir las dimensiones
fundamentales de un fenómeno pero con la
particularidad de que trabaja con variables
categóricas que proporcionan mapas perceptuales
que permiten una representación fácilmente
comprensible. - Algunos ejemplos
- Posicionamiento de productos y de atributos.
ANÁLISIS DE CASOS
14Análisis de correspondencia
RELACIONES ENTRE VARIABLES CATEGÓRICAS QUE SE
ANALIZAN MEDIANTE MAPAS PERCEPTUALES Y EFECTOS
FACTORIALES
A TRAVÉS DE FACTORES REDUCE LAS DIMENSIONES DE
ANÁLISIS
Paso intermedio para la aplicación de otras
técnicas como el análisis de cluster, regresión y
análisis discriminante.
Permite estudiar las formas que adoptan las
relaciones entre las variables
15Análisis de correspondencia
ETAPAS BÁSICAS
ANÁLISIS DE CORRESPONDENCIAS MÚLTIPLES
ANÁLISIS DE CORRESPONDENCIAS SIMPLES
Tablas multidimensionales
Tablas bidimensionales
- Preparar tablas de contingencia Perfiles filas
y columnas - Distancias chi-cuadrado entre filas y columnas
- Valores propios e inercia de valores propios
- Contribuciones absolutas y relativas
- Coordenadas de filas y columnas
- Representación factorial de filas y columnas
16(No Transcript)
17(No Transcript)
18Análisis cluster
- Partiendo de un conjunto de variables se
obtienen subconjuntos o grupos, ya sea de casos
ya sea de variables. Se busca establecer grupos
HOMOGÉNEOS internamente y HETEROGÉNEOS entre
ellos. - Algunos ejemplos
- En el campo del Marketing es útil para
clasificar e identificar segmentos, tipos de
productos, tipos de consumidores, etc.
ANÁLISIS DE CASOS
19Análisis cluster
- Responde a la necesidad de
- DIFERENCIAR
- CLASIFICAR
- SEGMENTAR (TIPOLOGÍAS)
SE PUEDEN AGRUPAR
CASOS / INDIVIDUOS
VARIABLES / CARACTERÍSTICAS
20Análisis cluster
CRITERIOS PARA DISTINGUIR GRUPOS
Criterio estricto (dicotómico)
Criterio estadístico (probabilidad)
- Se busca formar grupos mutuamente excluyentes y
colectivamente exhaustivos, pero los criterios de
agrupamiento y la medida de distancia pueden
producir cambios en la estructura de los grupos
21Análisis cluster
REQUISITOS y ETAPAS
- Representatividad de la MUESTRA
- Controlar la MULTICOLINEALIDAD entre las
variables - Definir MÉTODO y medidas de distancia para la
formación de grupos - Análisis de distancias euclídeas (diagrama en
árbol), esquemas de agrupación y de la media de
los grupos. - Delimitación del NÚMERO de grupos
significativos.
22Análisis de Cluster
23Análisis de Cluster
24Métodos multivariados
Problemas de causalidad
- Diferencian entre variables (a) explicativas,
independientes o predictivas, (b) variables a
explicar o dependientes, y (c) variables control
o intervinientes. - La distinción entre variables dependientes e
independientes debe efectuarse con arreglo a
fundamentos teóricos, por conocimiento o
experiencia y estudios anteriores. - Métodos de tipo
- EXPLICATIVOS /PREDICTIVOS
25Métodos multivariados
Problemas de causalidad
- Utilidad de este tipo de métodos
- Mide la fuerza y sentido de relaciones parciales
- Predice valores a partir de una serie de
variables - Explica el comportamiento de una o más variables
- Evalúa la bondad de ajuste de un modelo teórico
a los datos
- MÉTODOS
- ANÁLISIS DE VARIANZA (ANOVA)
- ANÁLISIS DE REGRESIÓN
- ANÁLISIS DISCRIMINANTE
- REGRESIÓN LOGÍSTICA
26Análisis de regresión
- Es suceptible de utilizar cuando contamos con
una variable dependiente métrica y variables
independientes métricas ó categóricas (ficticia). - Explica el comportamiento de la variable
dependiente (ej ventas, gastos, consumo), - Anticipa sus valores en función de los atributos
de las variables independientes (ej precio,
gasto en publicidad, atributos personales,
segmento de mercado) y - Estima las incidencias que cada una de éstas
tiene en la variable dependiente.
ANÁLISIS DE CASOS
27Análisis de regresión
TIPOS DE DATOS
- Los datos que se utilizan en la aplicación de
esta técnica pueden ser - SERIES DE TIEMPO y
- DATOS DE CORTE TRASVERSAL
- Modelo de Regresión Lineal Simple (MLS)
- Figura una sola variable explicativa, el
comportamiento de la variable Y se puede explicar
a través de la variable X - Modelo de Regresión Múltiple
- La variable dependiente viene explicada por
varias variables independientes.
28Análisis de regresión
HIPÓTESIS BÁSICAS
- Se supone que la forma funcional que liga la
variable explicada son las variables explicativas
es de tipo LINEAL al menos en los parámetros. - Las variables explicativas deben ser linealmente
INDEPENDIENTES, es decir, que no hay
multicolinalidad exacta.
29Análisis de regresión
REQUISITOS Y ETAPAS
- Control de distribución de errores
- Estimación de coeficientes e interpretación
- Intervalos de confianza y prueba de hipótesis
- Bondad de ajuste
- Predicción
- Variables ficticias
30Modelos de Regresión Lineal
ANÁLISIS DE UN EJEMPLO
El ingreso horario de los ocupados (entre 25 y 45
años) no se ve afectados por el sexo sino que
depende de la cantidad de años de instrucción
31EJEMPLO CORRELACIÓN
Total Ocupados entre 25 y 45 años (con ingresos)
32Modelos de Regresión Lineal
ANÁLISIS DE UN EJEMPLO
- BONDAD DE AJUSTE DEL MODELO (R2)
33Modelos de Regresión Lineal
ANÁLISIS DE UN EJEMPLO
- ANÁLISIS DE VARIANZA DE LOS MODELOS
34Modelos de Regresión Lineal
ANÁLISIS DE UN EJEMPLO
- COEFICIENTES B Y PRUEBAS T DE SIGNIFICANCIA
35Modelos de Regresión Lineal
Control de Supuestos
- Detección de MULTICOLINEALIDAD a través de tablas
de correlación simple entre las variables
independientes. Seleccionar las variables con
menor correlación o transformar en variables
ficticias no correlacionadas. - Detección de la HETEROSCEDASTICIDAD /a través de
gráficos de residuos ? para cada valor de y.
Estandarización de la variable dependiente Y. - Detección de la AUTOCORRELACIÓN DE ERRORES / a
través de la prueba Durbin-Watson. El valor 2
indica no autocorrelación. Corrección de
observaciones o eliminación de casos.
36Análisis de regresión logística
- Es un caso particular de regresión en el cual la
variable dependiente es de naturaleza dicotómica
y las independientes son cuantitativas o
categóricas y no exige restricciones tan fuertes
sobre la distribución de las variables
independientes. Estima y explica las
probabilidades de que un evento ocurra. - Estas peculiaridades la hacen interesante para
situaciones en las que no cabe aplicar la
regresión lineal. - Algunos ejemplos
- Identificar los principales factores que pueden
influir en aumentar la probabilidad de que un
nuevo producto sea introducido con éxito en el
mercado.
ANÁLISIS DE CASOS
37Análisis de regresión logística
- Permite construir un MODELO EXPLICATIVO a partir
de un conjunto de variables independientes de
tipo categóricas o continuas (estado civil,
ingresos, nivel de estudios, edad y números de
hijos) y una variable dicotómica o binaria que
solo definen opciones (contratar un servicio o
no, consumir determinado producto o no, etc.) - Ejemplo
- En qué medida ciertas características
socio-demográficas influyen en que un individuo
contrate un nuevo servicio de televisión por
cable. - En qué medida la aceptación de un producto está
relacionado con el nivel de ingresos del cliente?
38Análisis de regresión logística
REQUISITOS Y ETAPAS
- Proceso de codificación de las variables
independientes categóricas - Codificación de variable dependientes en 0 y 1
- Significancia de los coeficientes de regresión
- Significancia global del modelo
- Bondad de ajuste y eficacia predictiva
- Estimación de probabilidades parciales y
conjuntas - Métodos de selección de las variables
independientes (INTRODUCIR Y ELIMINACIÓN POR
PASOS)
39Modelos de Regresión Logística
ANÁLISIS DE UN EJEMPLO
- Classification Table for XCDEA
- The Cut Value is ,78
40Modelos de Regresión Logística
ANÁLISIS DE UN EJEMPLO
- Beginning Block Number 2. Method Enter
- Variable(s) Entered on Step Number
- 1.. H13 XMEN5
41Modelos de Regresión Logística
ANÁLISIS DE UN EJEMPLO