Title: Tema 1- Regresi
1- Tema 1- Regresión lineal simple.
- 1.1. Introducción
- 1.2. Especificación del modelo de regresión
lineal simple en la población. - 1.2.1. Estructura de los modelos de regresión
- 1.2.2. Hipótesis básicas
- 1.3. Estimación de los parámetros del modelo de
regresión lineal simple - 1.3.1. La recta de regresión de mínimos
cuadrados en puntuaciones directas y principales
propiedades - 1.3.2. La recta de regresión en puntuaciones
diferenciales - 1.3.3. La recta de regresión en puntuaciones
típicas - 1.3.4. Relación entre la pendiente de la recta
y el coeficiente de correlación - 1.3.5. Interpretación de los coeficientes de la
recta de regresión - 1.4. El contraste de la regresión
- 1.4.1.Componentes de variabilidad y bondad de
ajuste - 1.4.2. Validación del modelo
- 1.4.3. Significación de parámetros
- 1.5. Diagnosis del modelo Análisis de residuos
- 1.6. Predicción
2- Tema 1- Regresión lineal simple.
- 1.1. Introducción
- 1.1.1. Ejemplos de investigaciones en las que
puede ser adecuado utilizar el modelo de
regresión simple. - 1.1.2. El concepto de relación entre variables
naturaleza y tipos de relación. - 1.1.3. Herramientas para evaluar la relación
entre dos variables - 1.1.3.1. El diagrama de dispersión
- 1.1.3.2. La covarianza
- 1.1.3.3. El coeficiente de correlación de
Pearson
31.1. Introducción1.1.Ejemplos de
investigaciones en las que puede ser adecuado
utilizar el modelo de regresión simple.
- Se pretende estudiar si la competencia escolar de
niños, medida en una escala entre 1 y 4, depende
del tiempo en meses que llevan viviendo con un
progenitor - Variable dependiente o criterio (endógena)
competencia escolar - Variable independiente o predictora (exógena)
meses de monoparentalidad - Se pretende estudiar si el ajuste emocional de
niños, medido por un test de ajuste que
proporciona puntuaciones en una escala entre 0 y
10, depende del ámbito rural o urbano en el que
vive la familia - Variable dependiente o criterio ajuste emocional
- Variable independiente o predictora ámbito
geográfico
41.1. Introducción1.1.Ejemplos de
investigaciones en las que puede ser adecuado
utilizar el modelo de regresión simple.
- Se pretende estudiar la relación entre estrés
laboral y la variable trabajo a turno - Variable dependiente o criterio estrés laboral
- Variable independiente o predictora tipo de
turno fijo o variable - Se pretende estudiar si las notas en Análisis de
Datos II dependen de Análisis de Datos I - Variable dependiente o criterio Análisis de
Datos II - Variable independiente o predictora Análisis de
datos I
Para estudiar empíricamente estas relaciones
medimos, en una muestra de sujetos, los
valores de las variables incluidas en la
relación. Genéricamente, la información de un
sujeto cualquiera de la muestra Si, vendrá dada
por el par (Xi, Yi). El conjunto de pares
constituye la matriz de datos de la investigación
y para los ejemplos propuestos tendrá el
siguiente formato.
5Tabla o matriz de datos
N9
N10
Observar que las variable ámbito y turno aunque
no son métricas las hemos codificado como
numéricas. Hemos elegido el 0 y el 1 para
diferenciar entre las categorías de las
variables. Este tipo de codificación, muy
frecuente en estadística, se conoce como
codificación dummy o ficticia
N10
N10
61.1.2. El concepto de relación entre variables.
Naturaleza y tipos de relación el gráfico de
dispersión
71.1.2. El concepto de relación entre variables
naturaleza y tipos de relación.
81.1.2. El concepto de relación entre variables
naturaleza y tipos de relación.
9 1.1.3.2. La covarianza
La covarianza puede tomar valores entre (-8,8)
de manera que si Sxy 0 independencia
lineal Sxygt 0 relación lineal directa o
positiva Sxylt 0 relación lineal inversa o
negativa Vamos a ver, utilizando el gráfico de
dispersión, porque las relaciones De orden
anteriores están relacionadas con el tipo de
relación lineal.
10Sxylt 0 relación lineal inversa o negativa
Sxygt 0 relación lineal directa o positiva
Y
Y
X
Sxy 0 independencia lineal
X
Y
X
11(No Transcript)
12 1.1.3.2. La covarianza dependencia de escalas
13 1.1.3.3. El coeficiente de correlación de
Pearson
rxy 0
rxy 0.88
rxy 1
rxy -1
rxy -0.88
rxy 0
141.2. Especificación del modelo de regresión
lineal simple en la población.
1.2.1. Estructura de los modelos de regresión
predictora criterio independiente
dependiente exógena
endógena explicativa explicada
Expresión matemática del modelo en la población
Puntuación predicha por la recta de regresión
verdadera
Residuo o error de predicción
En el modelo hay dos variables observadas X e Y
y dos parámetros la ordenada en el origen de la
recta de regresión y la pendiente Interpretac
ión de los parámetros
15Interpretación de los parámetros
Esperanza de vida
Ejercicio físico
Consumo de tabaco
Esperanza de vida
161.2.2. Hipótesis básicas
1. El término de Error es una variable aleatoria
con media cero
2. Homocedasticidad la varianza del término de
error es constante
3. Los errores se distribuyen normalmente
4. Los errores son independientes entre sí.
Las hipótesis anteriores pueden formularse de
manera equivalente en términos de la variable
criterio. Así,
3. La distribución de Y es normal para cada X
4. Las observaciones Yi son independientes entre
sí.
17Resumen gráfico de las hipótesis básicas
formuladas en términos de la variable criterio
Distribución Normal
X1, X2, X3, X4
18Resumen gráfico de las hipótesis básicas
formuladas en términos de los residuos
?
0
X1, X2, X3,
X4
19El objetivo del análisis de regresión será
estimar los parámetros del modelo presentado y
contrastar las hipótesis de partida todo ello a
partir de una muestra.
201.3. Estimación de los parámetros del modelo de
regresión lineal simple
- 1.3.1. La recta de regresión de mínimos cuadrados
en puntuaciones directas y principales
propiedades - 1.3.2. La recta de regresión en puntuaciones
diferenciales - 1.3.3. La recta de regresión en puntuaciones
típicas - 1.3.4. Relación entre la pendiente de la recta y
el coeficiente de correlación - 1.3.5. Interpretación de los coeficientes de la
recta de regresión
211.3.1. La recta de regresión de mínimos cuadrados
en puntuaciones directas y principales propiedades
Partimos de una muestra de sujetos extraídos de
una población en la que se han tomado valores de
las variables X e Y. La situación más frecuente
es que los puntos estén dispersos en el plano
definido por X e Y. La primera pregunta a
plantearnos es de las infinitas rectas que
podemos ajustar a la nube de puntos Cuál
estimará mejor los parámetros?. Existen
diferentes criterios.
221.3.1. La recta de regresión de mínimos cuadrados
en puntuaciones directas y principales propiedades
231.3.1. La recta de regresión de mínimos cuadrados
en puntuaciones directas y principales propiedades
Criterio de mínimos cuadrados
24Recta de regresión mínimo cuadrática
(puntuaciones directas)
25Ejemplo de cálculo de la recta de regresión de
mínimos cuadrados
26Recta de regresión mínimo cuadrática
dependencia de escalas.xls
27Propiedades de la Recta de regresión mínimo
cuadrática
1) La media de las puntuaciones predichas es
igual a la media de Y 2) Los errores tienen
media cero 3) La recta de mínimos cuadrados pasa
por el punto 4) Los errores no correlacionan
ni con la variable predictora ni con las
puntuaciones predichas
28a) Modelo y recta en puntuaciones diferenciales
29a) Modelo y recta en puntuaciones estandarizadas
30 Recta de regresión en diferenciales y en
tipificadas. Relación entre b y r. Interpretación
de los coeficientes de la regresión
a) En puntuaciones directas
b) En puntuaciones diferenciales
c) En puntuaciones estandarizadas
311.4. El contraste de la regresión introducción
321.4. El contraste de la regresión introducción
331.4. El contraste de la regresión introducción
341.4. El contraste de la regresión introducción
351.4. El contraste de la regresión introducción
Yi
Xi
361.4.1.Componentes de variabilidad y bondad de
ajuste
Yi
Desviación Desviación Desviación
total explicada
residual
Xi
371.4.1. Componentes de variabilidad y bondad de
ajuste
Variación Total
Variación Residual
Variación Explicada
Xi
381.4.1. Componentes de variabilidad y bondad de
ajuste
Fórmulas para calcular las sumas de cuadrados en
puntuaciones directas y diferenciales
39Fórmulas para calcular las sumas de cuadrados en
tipificadas
401.4.1. Componentes de variabilidad y bondad de
ajuste
Bondad de ajuste o Coeficiente de determinación
411.4.1. Componentes de variabilidad y bondad de
ajuste
Representación en diagramas de Venn
r2xy 0
Y
X
r2xy 1
X
Y
r2xy
Y
X
421.4.2. Validación del modelo
Esquema del Contraste de Hipótesis
Contrastar una Hipótesis Estadísticamente es
juzgar si cierta propiedad supuesta para una
población es compatible con lo observado en una
muestra de ella.
43Elementos de una Prueba de Hipótesis
1.- Hipótesis Nula (H0), Hipótesis
Alternativa. 2.- Estadístico de Contraste
(Discrepancia). 3.- Región de Rechazo (Región
Crítica) nivel de significación. 4.- Regla de
Decisión.
441.4.2. Validación del modelo
1.- Hipótesis Nula (H0), Hipótesis Alternativa.
2.- Estadístico de Contraste (Discrepancia).
451.4.2. Validación del modelo
3.- Región de Rechazo (Región Crítica) nivel de
significación.
Región de aceptación de H0
Fc
461.4.2. Validación del modelo
4.- Regla de Decisión.
Se rechaza la H0 si F gtFc o de manera
equivalente si p lt ?
Por el contrario, se acepta la H0 si F ? Fc o
de manera equivalente si p ?
47Tabla F
48Tabla F
491.4.3. Significación de parámetros
1.- Hipótesis Nula (H0), Hipótesis Alternativa.
2.- Estadístico de Contraste (Discrepancia).
Nota en regresión simple t2 F
501.4.3. Significación de parámetros
3.- Región de Rechazo (Región Crítica) nivel de
significación.
Región de aceptación de H0
?
Fc
511.4.3. Significación de parámetros
4.- Regla de Decisión.
Se rechaza la H0 si ?t? ? gttc o de manera
equivalente si p lt ?
Por el contrario, se acepta la H0 si ? t ? ?
tc o de manera equivalente si p?
52http//www.stat.ucla.edu/dinov/courses_students.d
ir/Applets.dir/T-table.html
53Tabla t de Student
The t-Distribution Table
54Calculadoras estadísticas en internet
http//faculty.vassar.edu/lowry/VassarStats.htm
http//members.aol.com/johnp71/pdfs.html
http//davidmlane.com/hyperstat/F_table.html
http//davidmlane.com/hyperstat/t_table.html
http//www.psychstat.missouristate.edu/introbook/t
dist.htm
http//www.psychstat.missouristate.edu/introbook/f
dist.htm
http//calculators.stat.ucla.edu/cdf/
551.6. Predicción
Intervalos de predicción
56(No Transcript)