Title: Regresin
1Regresión
- Cap. 12 de Samuels
- Problemas asociados 2, 4, 5, 13, 20, 22, 27, 30,
32, 37, 41, 45, 46, 47, 53
2Regresión es una forma de encontrar una función
que se aplica a un conjunto de observaciones. Lo
normal es que haya dos variables las cuales son
de dos tipos variable experimental y variable
respuesta. Antes se llamaban dependiente e
independiente. La variable Y es la respuesta
observada de la variable X, por lo tanto están
pareadas. Las variables X pueden ser de dos
tipos escogidas por el investigador y pueden ser
observadas al igual que las Y, en este último
caso el investigador no tiene ningún control
sobre los valores de X. Ambas se calculan igual,
pero la interpretación de cada caso puede ser
diferente.
3Regresión lineal
Si la función es lineal (las variables
experimentales están elevadas a la 1), entonces
la relación es lineal y la regresión se llama
regresión lineal. Si Y es la variable respuesta
y hay una variable experimental X, entonces la
función está en la forma familiar de
yi b0 b1xi con n observaciones (el índice va
de 1 a n)
La regresión lineal no indica que X causa Y,
solamente que ambas están asociadas de alguna
manera.
4Coeficiente de determinación
- Indica qué tan bien la línea y los datos están
ajustados. - El método usado es el de los mínimos cuadrados
5Cálculo del intercepto
Es la media de x
Es la media de y
b1 es la pendiente de la línea
Ahora podemos calcular el intercepto
De yi b0 b1xi vamos a
6(SUM(G2G10))/SUM(E2E10)(SUM(B2B10)/9)-(H2SU
M(A2A10)/9)
Fórmulas en Excel para calcular b1 y b0
7Explicación de residual
8Definición de residual
La línea siempre pasa por la media de x y la
media de y
Residual yi - y
9Suma residual de cuadrados
10Criterio de mínimos cuadrados
La línea más ajustada es la que minimiza la suma
residual de cuadrados. La suma residual de
cuadrados nos permite calcular la desviación
estándar de los residuales
yx quiere decir que x se ha utilizado para
predecir y
11Cuando la regresión lineal no sirve
- Cuando la relación es una curva.
- Cuando hay puntos demasiado lejos de la curva.
- Cuando un punto tiene demasiada importancia
Soluciones transformaciones log., cuadrados,
inversos.
12Desviación estándar
Esta fórmula nos dice lo mismo que cualquier
desviación estándar, es decir que el 95 de los
residuales cae dentro de dos desviaciones
estándar de la línea.
13Problema 12.1 pag 536
Para cada x hay un valor de y
14Coeficiente de determinación
La relación es la siguiente SS(total)
SS(regresión) SS(residuales)
La variabilidad total es la variabilidad de la
regresión sumada a la variabilidad residual.
15Error estándar
16T-test
ts b1/SEb1
CI b1 ta/2SEb1
H0ß1 0 Entonces no hay relación entre X y Y
HAß1 ? 0 Entonces hay relación entre X y Y
Se usan 2 grados de libertad fd n-2
17Coeficiente de correlación
Correlación