Title: Regresi
1Regresión Lineal Simple
Lic. César Octavio Contreras
2INTRODUCCIÓN
- ORIGEN HISTORICO
- Después de estudiar cómo hay que organizar,
representar gráficamente y analizar un conjunto
de datos a partir de algunos parámetros, nos
proponemos estudiar las relaciones entre
variables. - Queremos construir modelos que describan la
relación entre las variables con el propósito,
principalmente, de predecir los valores de una
variable a partir de los valores de la otra. Lo
haremos con el modelo de regresión lineal simple.
3INTERPRETACIÓN MODERNA
- El análisis de regresión trata del estudio de la
dependencia de la variable dependiente, respecto
a una o más variables (las variables
explicativas), con el objetivo de estimar y/o
predecir la media o valor promedio poblacional de
la primera en términos de los valores conocidos o
fijos (en muestras repetidas) de las ultimas.
4Regresión vs Causalidad
- Una relación estadística, sin importar que tan
fuerte y sugestiva sea, nunca podrá establecer
una conexión causal nuestras ideas de causalidad
deben venir de estadísticas externas y, en último
termino, de una u otra teoría. - Una relación estadística no puede por si misma
implicar en forma lógica una causalidad.
5Relaciones entre dos variables
- El objetivo es explicar el comportamiento de una
variable Y, que denominaremos variable explicada
(o dependiente o endógena), a partir de otra
variable X, que llamaremos variable explicativa
(o independiente o exógena). - Ejemplo Si las dos variables son los ingresos
mensuales y los gastos en actividades de ocio
6Las relaciones entre dos variables pueden ser de
dos tipos
- 1) Funcionales (o deterministas) cuando hay una
fórmula matemática que permite calcular los
valores de una de las variables a partir de los
valores que toma la otra. - 2) Estadísticas (o estocásticas) cuando no
existe una expresión matemática que las relacione
de forma exacta.
7Ejemplo de las alturas y los pesos
8Recta de regresión
- Una vez que hemos hecho el diagrama de dispersión
y después de observar una posible relación lineal
entre las dos variables, nos proponemos encontrar
la ecuación de la recta que mejor se ajuste a la
nube de puntos. Esta recta se denomina recta de
regresión.
9Estimación de los parámetros método de los
mínimos cuadrados
- y a bx
- El método de los mínimos cuadrados consiste en
buscar los valores de los parámetros a y b de
manera que la suma de los cuadrados de los
residuos sea mínima. Esta recta es la recta de
regresión por mínimos cuadrados.
10Las soluciones de este sistema de ecuaciones son
Sxy es la covarianza muestral de las
observaciones (xi, yi). S2x es la varianza
muestral de las observaciones xi.
11(No Transcript)
12EJERCICIOS
13Impacto de los gastos en publicidad
- Los datos proporcionados en la siguiente tabla se
publicaron en la edición correspondiente al
primero de marzo de 1984 del periódico Wall
Street Journal. Se refiere al presupuesto
publicitario de 21 empresas para el año de 1983 y
a las veces que los clientes observan los
comerciales de los productos en una semana de
dichas compañias. - Haga una grafica poniendo las impresiones en el
eje vertical y el gasto publicitario en el eje
horizontal. - Que se podría decir respecto a la naturaleza de
la relación entre las dos variables? - Realiza una regresión lineal con estos datos
14Empresa Impresiones Gasto Pub.
Bud Lite 10.4 45.6
ATT 88.9 154.9
Calvin Klein 12 5
Wendys 29.2 49.7
Polaroid 38 26.9
Shasta 10 5.7
Meow Mix 12.3 7.6
Oscar Meyer 23.4 9.2
Crest 71.1 32.4
Kibbles N Bits 4.4 6.1
Empresa Impresiones Gasto Pub.
Miller Lite 32.1 50.1
Pepsi 99.6 74.1
Strohs 11.7 19.3
Fedl Express 21.9 22.9
Burguer King 60.8 82.4
Coca Cola 73.6 40.1
McDonalds 92.4 185.9
MCI 50.7 26.9
Diet Cola 21.4 20.4
Ford 40.1 166.2
Levis 40.8 27
15(No Transcript)
16De que depende las victorias de un equipo de Base
B
- VICTORIAS 3.083258 524.4436BATEO
0.016592BASESROB - 0.199310ERRORES
13.46487PROMCARR 0.095243JONRON
-0.880311SUPERFICIE
BATEO.- La variable del promedio de bateo del
equipo resulto relacionado positivamente con el
numero de victorias del equipo lo cual resulta
lógico, pues entre mas ocasiones están frente al
bat se incrementa la probabilidad de hacer mas
carreras lo cual resulta en victorias.
BASESROB.- La variable del número de bases
robadas resulta también con una relación positiva
con el numero de victorias del equipo, pues entre
mas bases roben los jugadores realizarán mas
carreras lo cual, de nuevo, consigue mas
victorias para el equipo. ERRORES.- El número de
errores cometidos se relaciona negativamente con
el número de victorias, pues entre mayor sea el
numero de errores cometidos por el equipo con
mayor probabilidad perderán el partido. PROMCARR.-
El promedio de carreras del equipo se relaciona
de manera negativa. JONRON.- El numero de
cuadrangulares, lógicamente tiene una relación
positiva con el numero de victorias del equipo,
pues entre mas cuadrangulares anoten los
jugadores será mas probable que ganen mas
partidos. SUPERFICIE.- La variable superficie del
terreno, tiene una relación negativa con el
número de victorias, lo que nos dice que si la
cancha del equipo en estudio es artificial
aumenta la probabilidad de perder mas partidos.
17Regresión Lineal Simple
Lic. César Octavio Contreras