Title: Modelo b
1Modelo básico de regresión Lineal(MBRL)
- Rafael de Arce y José Ángel Fernández Sampedro
- UAM
2Introducción
3Bases del Método de Regresión Lineal
MATEMÁTICAS
MBRL
FORMULACIÓN DE UNA TEORÍA IMPLICANDO CAUSALIDAD
MEDIR RELACIONES ENTRE VARIABLES
ESTADÍSTICA
4Definición
- Método estadístico que permite cuantificar una
relación de dependencia entre variables
cuantitativas (1) - Variable Endógena (explicada) ?Y
- V. Dependiene, V. de respuesta, Regresando, V.
causada - Variable/s Exógena/s (explicativas) ?X
- V. Independiente, V de control, Regresor, V.
causante - Los MBRL pueden ser
- Simples Una sola variable exógena
- Múltiples Más de una variable exógena
- (1) Excepcionalmente, entre las variables
explicativas puede haber alguna cualitativa
5El Tiempo y el espacio en los MBRL
- Datos de corte transversal
- Distintas observaciones consideradas en el mismo
momento del tiempo - Ejemplo (1) número de viviendas construidas en
cada CC.AA. durante el año 2007. (2) Presión
sanguínea de un grupo de 20 pacientes. - Datos de series temporales
- Observaciones de una misma variable recogidas en
diferentes periodos de tiempo. - Ejemplo (1) número de viviendas construidas en
Madrid a lo largo de los últimos 20 años. (2)
Presión sanguínea de un paciente en las últimas
24 horas. - Datos de Panel
- Observaciones de cada uno de los individuos a
través del tiempo - Ejemplo (1) evolución del número de viviendas
construidas en cada CC.AA. en los últimos 20
años, (2) Presión sanguínea de 20 pacientes con
mediciones cada 10 minutos en las últimas 24
horas.
6Fases del Método de Regresión Lineal
- Especificación del Modelo
- Apoyado en una teoría, se plantea que una
variable es explicada por otras u otras - Se determina la forma de cuantificar cada una de
estas variables (explicada y explicativas) - Se recopila información estadística sobre ellas
- Se plantea la relación matemática que conecta
variable explicada y explicativas - Estimación del modelo
- Se determina el valor de los parámetros que
conectan cada una de las variables explicativas
con la explicada - Contraste y validación del modelo
- A partir de análisis de significatividad
estadística y del ajuste entre los resultados
reales y los obtenidos con el modelo (errores) se
determina la validez del modelo - Utilización del modelo
- Predicción y simulación del posible
comportamiento de la variable explicada ante
cambios en la variable explicativa - Análisis estructural determinación de la
importancia relativa de cada variable explicativa
para determinar a la explicada - Contraste de teorías la especificación
realizada se confirma con los datos?
7Ejemplo de Especificación
- Teoría la probabilidad de que cambie el partido
del presidente de los EE.UU. viene explicada por
si durante el mandato ha habido
crecimiento/decrecimiento económico. - La forma en la que se relacionan estas variables
explicativas con la explicada es una función
logística (linealizable). - Las variables a emplear, tomadas desde 1900 hasta
2004, son las siguientes - Explicada toma valor uno si hay cambio de
partido en el gobierno y cero si no lo hay. - Variable crecimiento número de años de
decrecimiento económico durante cada mandato
presidencial
8Tabla de datos
Período Presidente Partido Cambia partido Años crisis
1900 William McKinley Republican 0 1
1904 Theodore Roosevelt Republican 0 2
.. .. .. .. ..
.. .. .. .. ..
1984 Ronald Reagan Republican 0 2
1988 George H. Bush Republican 0 3
1992 William J. Clinton Democratic 1 3
1996 William J. Clinton Democratic 0 2
2000 George W. Bush Republican 1 1
2004 George W. Bush Republican 0 2
9Aproximación intuitiva
10Diagrama de dispersión
11Recta de ajuste
12Recta El mejor ajuste y un buen ajuste
Manual SPSS Pgs 1-4 a 1-8
13El modelo básico de regresión lineal
14De la relación causal teórica al planteamiento
del modelo
- Las variables explicativa son no estocásticas
- E (u) 0
- Var (u) constante
- E(ui, uj) 0 para todo ij
15Hipótesis Básicas del Modelo
- Muestra suficiente
- Regresores deterministas
- No multicolinealidad
- Exogeneidad
- Permanencia Estructural
- Media nula de las pertubaciones aleatorias
- Homocedasticidad
- No autocorrelación
- Distribución normal de las perturbaciones
aleatorias
16Estimación de los parámetros
- Mínimos Cuadrados Ordinarios
- Aquellos que minimizan la suma de los residuos al
cuadrado. - El error cometido en la estimación (residuo) es
el estimador de la perturbación, y por tanto el
objetivo a minimizar. - Máxima Versomilitud
- Hacen máxima la función de verosimilitud (función
de densidad conjunta de la información muestral) - Requieren conocer la distribución de probabilidad
del modelo
17Deducción de los estimadores MCO (I)
- Se busca la recta que minimizan la suma al
cuadrado de los residuos
18Aplicación Práctica (Modelo simple)
19Aplicación Práctica (Modelo simple)
- Ecuación de regresión
- Bondad de ajuste
20CONTRASTE
- Sig Probabilidad de equivocarme si rechazo la
hipótesis nula - Sig lt0,05 Rechazo la Hipótesis nula
- Contraste de Significatividad conjunta del
modelo F -
- Contraste de Significatividad individual de cada
uno de los parámetros t -
21MBRL Múltiple
- Planteamiento
-
- Hipótesis
- Independencia en los residuos No autocorrelación
- Homocedasticidad Varianza de residuos constante
- No-colinealidad No existe relación lineal exacta
entre ninguna variable independiente. - Normalildad
22Utilización del Modelo
- Predicción sabiendo que un sujeto entró en la
empresa con un salario de 1000 euros, cuál será
su salario actual? - Simulación Cuál sería el salario actual de un
sujeto que hubiera entrado en la empresa con un
salario de 1000 euros? y si fuera de 500 euros? - Contraste de teorías la variable salario
inicial sirve para explicar el salario actual?
Sí, ya que el valor de su parámetro estimado
siempre es distinto de cero.