Title: LA RECTA DE REGRESI
1LA RECTA DE REGRESIÓN
- CONTENIDOS
- Dependencia funcional y dependencia estadística
- Concepto de regresión
- Es buena la aproximación?
- Error cuadrático medio, varianza residual
- coeficiente de determinación lineal
2Independencia - Dependencia
- Al estudiar dos características simultáneamente
de una muestra - están relacionadas? interdependencia? cómo lo
hacen? - altura vs peso. horas de estudio vs calificación
en un examen. - El objetivo principal es determinar el modo en
que se relacionan. - Dos variables pueden considerarse
- Independientes ? ninguna explica el
comportamiento de la otra - Dependencia funcional (exacta) ? Yf(x)
- Dependencia estadística ? está entre las dos
anteriores
Dependencia funcional
Dependencia estadística
Independencia estadística
-
Grado de asociación entre dos variables
3Estudio conjunto de dos variables
- A la derecha tenemos los datos obtenido
observando dos variables estadísticas en varios
individuos de una muestra. - En cada fila tenemos los datos de un individuo
- Cada columna contiene los valores que toma una
variable sobre los individuos. - Las individuos no se muestran en ningún orden
particular. - Podemos representar las observaciones en un
diagrama de dispersión (scatterplot). En él,
cada individuo es un punto cuyas coordenadas son
los valores de las variables. - En primera instancia, pretendemos reconocer a
partir del diagrama si hay relación entre las
variables, de qué tipo y, si es posible predecir
el valor de una de ellas en función de la otra.
Altura en cm. Peso en Kg.
162 61
154 60
180 78
158 62
171 66
169 60
166 54
176 84
163 68
... ...
4Diagramas de dispersión o nube de puntos
Altura y peso de 30 individuos.
Pesa 76 kg.
Pesa 50 kg.
Mide 187 cm.
Mide 161 cm.
5Relación entre variables.
Altura y peso de 30 individuos.
Parece que el peso aumenta con la altura
6Relación entre variables.
Altura y peso de 30 individuos.
Parece que el peso aumenta con la altura
7Relación entre variables.
- Qué recta explica mejor la relación
peso-altura? - mejor...en qué sentido?
Altura y peso de 30 individuos.
Parece que el peso aumenta con la altura
8RECTA DE REGRESIÓN
Pendiente
yi
Ordenada en el origen
Error residuo
9RECTA DE REGRESIÓN
Llamemos a u residuo, perturbación o error es
la diferencia que hay entre el valor observado de
la variable y y el valor que tendría (valor
estimado) si la relación fuera lineal, es decir,
través de la recta de regresión
IDEA hacer MÍNIMA la suma de los CUADRADOS de
los residuos.
10EQUIVALE a buscar los coeficientes de la recta
hace MÍNIMA la suma de los CUADRADOS de los
residuos.
La recta de regresión de y sobre x es Es
decir, los valores de los coeficientes son
Covarianza
11Es la recta de regresión una buena aproximación
de la nube de puntos?
Coeficiente de determinación
Diferencia entre el valor estimado y la media
observada Diferencia entre lo observado y la
media observada
Varianza residual ó error cuadrático medio Ayuda
a medir la dependencia.
VR
Coeficiente de correlación lineal de Pearson r
12Covarianza de dos variables X e Y
- La pendiente de la recta de regresión es Sxy/ S2X
- El signo de la covarianza indica si la posible
relación entre dos variables es directa o
inversa. - Directa Sxy gt0
- Inversa Sxy lt0
- Incorreladas Sxy 0
- La covarianza no dice nada sobre el grado de
relación entre las variables.
13Coef. de correlación lineal de Pearson
- La coeficiente de correlación lineal de Pearson
de dos variables, r, nos indica si los puntos
tienen una tendencia a disponerse alineadamente
(excluyendo rectas horizontales y verticales). - tiene el mismo signo que Sxy por tanto de su
signo obtenemos el que la posible relación sea
directa o inversa. - r es útil para determinar si hay relación lineal
entre dos variables
14Propiedades de r
- Es adimensional
- Sólo toma valores en -1,1
- Las variables son incorreladas ? r0
- Relación lineal perfecta entre dos variables ?
r1 o r-1 - Excluimos los casos de puntos alineados horiz. o
verticalmente. - Cuanto más cerca esté r de 1 o -1 mejor será el
grado de relación lineal. - Siempre que no existan observaciones anómalas.
Relación inversa perfecta
Relación directa casi perfecta
Variables incorreladas
-1
1
0
15Coeficiente de determinación
- No mide la validez del modelo de regresión
propuesto. - Sí mide cuanto de la variabilidad se explica por
la ecuación de regresión estimada.
16- Hemos usado materiales de
- Julián de la Horra Navarro.
- Estadística aplicada, 3ª edición. Díaz de
Santos. - G.C. Canavós.
- Estadística y probabilidad. Métodos y
aplicaciones. McGrawHill - Francisco Javier Barón
- http//www.bioestadistica.uma.es/baron/apuntes
- Sara Mateo
- http//www.dea.uib.es/webpersonal/williamnilsson
/archivos/Capitulo7.ppt
17DE DÓNDE SALEN LOS COEFICIENTES DE LA RECTA DE
REGRESIÓN?
Qué a y b minimizan la suma de los cuadrados
de los errores cometidos?
MINIMIZAR
El valor que hemos aproximado para y con la
recta de regresión ?
Errores cometidos al aproximar por una recta