Title: ESTAD
1ESTADÍSTICA PARA LA ADMINISTRACIÓN
2Introducción a la Estadística
- La palabra estadística tiene 2 significados
- Estadística 1 hechos numéricos sistemáticamente
recolectados 2 Ciencia de recolectar, clasificar
y utilizar estadísticas - (Oxford Concise Dictionary)
- Por ejemplo.
3Algunas definiciones de Estadistica.
- Rama de las matemáticas que proporciona
herramientas que permiten manejar grandes
cantidades de datos, convirtiendolos en
información útil. - Forma de decir mentiras con fundamentos
matemáticos.
4DEFINICION
- Es una ciencia, pues aplica el Método Científico
al ocuparse de la recolección, organización,
análisis, interpretación y presentación de datos,
tanto para la deducción de conclusiones como para
la toma de decisiones razonables de acuerdo a
tales análisis.
5Introducción (cont.)
- La ciencia de la Estadística utiliza
- matemáticas (teoría de probabilidades)
- ciencia de las computadoras (graficos and
simulaciones) - filosofía
- Qué distingue a la Estadística de las
matemáticas? - La estadística hace uso de las matemáticas
6Introducción (cont.)
- La Estadística enfatiza la VARIABILIDAD NATURAL
- De individuos (personas, plantas, ratas, ovejas,
bombillas de luz, precios de acciones, etc). - La Estadística es utilizada por
- científicos
- biólogos
- químicos
- físicos
- psicólogos
- economistas
7Introducción (cont.)
- La Estadística se usa para
- Informar al publico
- Proveer comparaciones
- Explicar resultados
- Influenciar decisiones
- Justificar un reclamo o afirmación
- Predecir futuros resultados
- Establecer una relación o asociación
- Estimar cantidades desconocidas
8Introducción (cont.)
- Los Estadísticos (personas que estudian la
estadística) - Entienden la idea de la variabilidad de los
individuos - Se toman el tiempo siendo lógicos, profundos e
imparciales cuando preparan resultados y reportes - Se cuidan de no sacar conclusiones que están
fuera de los límites de la pregunta que debe
responderse mediante la estadística
9- UNIDAD DE ESTUDIO Es el elemento mas pequeno al
que podemos hacer referencia en un estudio
estadistico. - COLECTIVO Es todo conjunto compuesto por mas de
una unidad de estudio un colectivo puede ser
una MUESTRA o una POBLACION.
10Datos
- Datos son piezas de información
- Varias piezas de datos forman un conjunto de
datos - Los Datos se componen de los objetos que han
sido medidos (eg personas, arboles, ratas) y los
atributos que fueron registrados (edad, tamaño,
ph, costo, peso, etc) - objetos son aka sujetos, casos, entidades, etc
- Atributos son aka caracteristicas, variables,
factores, etc
11Variables
- Cuando medimos los atributos de un objeto,
obtenemos un valor que varía entre objetos. Por
ejemplo considere las personas en esta clase como
objetos y su estatura como el atributo - El atributo altura varía entre objetos, de ahí
que los atributos son mas colectivamente
conocidos como variables
12TIPOS DE VARIABLES
- DISCRETAS Son aquellas que toman valores
puntuales en una escala, ejemplo No. de unidades
producidas, No. de quintales transportados, etc. - CONTINUA Son aquellas que pueden tomar
cualquier valor real en una escala, por
ejemploTemperatura, peso, longitud, etc.
13Tipos de Datos
- Las Variables pueden ser medidas en cuatro
escalas diferentes - Es escencial que sea capaz de identificar las
cuatro diferentes escalas de medición y ejemplos
de cada una
141 Escala Nominal de Medición
- Los datos son medidos al nivel nominal donde cada
caso es clasificado en una de un numero discreto
de categorías - EG Color, Partido Politico, Genero, etc
152 Escala Ordinal de Medición
- Los datos son medidos en una escala ordinal si
las categorías implican orden - EG Rango Militar, Talla de ropa, etc
- La diferencia entre rangos es consistente en
dirección, pero no en magnitud.
163 Escala de medición de Intervalo
- Si las diferencias entre los valores tienen
significado, los datos son medidos en la escala
de Intervalo. - La temperatura es el mejor ejemplo
174 Escala de medición de Ratio (rata)
- Los datos medidos en una escala de ratio tienen
diferencias que son significativas, y relativas a
algun punto real de origen o cero. - eg Peso, Altura, edad, etc
- Esta es la escala más común de medición.
18Tipos de Datos (Cont.)
- Datos de tipo Ordinal, Intervalo y Ratio también
se conocen como datos Cuantitativos - Datos de tipo Nominal también son denominados
datos Cualitativos -
19Dos tipos de Estadística
- Estadística Descriptiva
- métodos de resumir grandes cantidades de datos en
una forma conveniente - Estadística Inferencial
- Métodos para extraer conclusiones (hacer
inferencias) respecto a las características de
una población - por ejemplo.
20- POBLACION Se le llama población o universo, al
conjunto total de unidades de estudio que se
desean investigar. - MUESTRA Es un subconjunto de una población. Se
utiliza cuando la población es muy numerosa,
infinita o muy difícil de examinar. - MUESTRA ALEATORIA Es cuando cada elemento tiene
la misma oportunidad de ser escogido. - Muestreo aleatorio estratificado
- Muestreo aleatorio sistematico
21Poblaciones
- Un componente esencial de entender la ciencia de
la estadística es entender estos términos - La población consiste en el conjunto de todas las
mediciones en que el investigador está interesado - Un número que describe una población se denomina
un parametro - por ejemplo...
22Muestras
- Una muestra es un subconjunto de datos de la
población - Un numero que describe una muestra es un
estadístico - por ejemplo...
23Inferencia
- Si tomamos una muestra y calculamos un
estadístico, utilizamos ese estadístico para
inferir algo respecto a la población de la cual
la muestra fue extraída. - EG Comunmente, las muestras son utilizadas para
inferir respecto a - Resultados de Elecciones
- Preferencias del consumidor
- Actitudes hacia aspectos sociales
- Se le ocurre algún otro ?????
24CONTENIDO
- Estadistica Descriptiva
- Regresion y Correlacion
- Distribuciones
- Control Estadistico de Procesos
25- ESTADISTICA DESCRIPTIVA
- Es la parte de la Estadística que trata
solamente de describir y analizar un colectivo,
sin sacar conclusiones o inferencias de un
colectivo mayor, a partir de ella. - La Estadística descriptiva incluye las técnicas
que se relacionan con el resumen y la descripción
de datos. Estos datos pueden ser representados
en forma gráfica y pueden incluir análisis por
computadora.
26ESTADISTICA DESCRIPTIVA
- MEDIDAS DE TENDENCIA CENTRAL
- MEDIDAS DE DISPERSION
- MEDIDAS DE ORDEN
- MEDIDAS DE FORMA
- REPRESENTACION GRAFICA
27MEDIDAS DE TENDENCIA CENTRAL
- MEDIA (ARITMETICA O PONDERADA)
- MODA
- MEDIANA
28MEDIDAS DE DISPERSIÓN
- Rango
- Desviacion Media
- Varianza
- Desviación Típica o standard
29MEDIDAS DE ORDEN
- Cuartiles
- Deciles
- Percentiles
30MEDIDAS DE FORMA
31REPRESENTACION GRAFICA
- Histograma de frecuencias
- Diagrama de Pareto
- Ojiva de Frecuencias Acumuladas
- Diagrama de Pastel
- Diagrama de Cajas
- Diagrama de Tallos y Hojas
32MEDIA ARITMETICA
33EJEMPLO
34MEDIAPONDERADA
35EJEMPLO
36Mediana
- Valor que divide la serie de datos en dos partes
iguales. - Si el numero de datos es impar, es el valor que
está situado justo en medio. - Si el número de datos es par, es el promedio
aritmético de los dos datos de en medio.
37EJEMPLO
38Moda
- Es el valor que mas se repite en un conjunto de
datos. - Puede no existir o puede existir mas de uno.
39EJEMPLO
40(No Transcript)
41EJEMPLO
42(No Transcript)
43EJEMPLO
44(No Transcript)
45EJEMPLO
46(No Transcript)
47RESULTADO DEL PROCESO DE LLENADO INDUSTRIAL DE
REFRESCOS (en ml)
48DATOS ORDENADOS
49MEDIDAS DE TENDENCIA CENTRAL
50MEDIDAS DE DISPERSION
51CONSTRUCCION DE UNA TABLA DE FRECUENCIAS
52TABLA DE FRECUENCIAS
53(No Transcript)
54HISTOGRAMA DE FRECUENCIAS
55(No Transcript)
56MEDIDAS DE ORDEN
- Son aquellas que nos permiten ubicar un dato de
acuerdo a la posicion que ocupa dentro de la
serie de datos. - Nos permiten ordenar, clasificar y categorizar
los datos. - Tambien se conocen como fractilos porque dividen
los datos en partes iguales.
57FRACTILOS
- De acuerdo al numero de partes en que se dividan
los datos los fractilos pueden ser - Cuartiles si dividen a los datos en cuatro
partes iguales. - Deciles si dividen a los datos en diez partes
iguales. - Percentiles o Centiles si dividen a los datos en
cien partes iguales.
58FRACTILOS cont...
- Por ejemplo, los cuartiles dividen la
distribucion de datos en cuatro partes iguales,
cada una conteniendo el 25 de los datos. - De lo anterior se deduce que, como se dijo
anteriormente, si la mediana divide los datos en
dos partes iguales, debe ser igual al cuartil 2,
al decil 5 y al percentil 50.
59FRACTILOS cont...
- Forma de calculo
- D de partes en que vamos a dividir los
datos (para cuartiles 4, para deciles 10, para
percentiles 100). - F del fractilo a calcular, es decir, si
queremos calcular el tercer cuartil, F es igual a
3, si queremos calcular el sexto decil, F es
igual a 6, etc. - N de datos en la distribucion.
60FRACTILES cont...
- Entonces, la posicion del fractilo esta dada por
- FN (D-F)
D - Ejemplo Para calcular el cuartil 3 de 50 datos
- 350 (4-3) 4
- 37.75, es decir que el tercer cuartil esta
ubicado entre el dato 37 y el 38, a un 75 de la
distancia entre ambos datos.
61EJEMPLO
- Para continuar con el ejemplo de las dos maquinas
llenadoras, vamos a calcular los cuartiles 1 y 3
para cada maquina, entonces - D 4
- N 50
- F 1 y 3
- 150 (4-1) 4
- 13.25 para el cuartil 1
- 350 (4-3) 4
- 37.75 para el cuartil 3
- Esto quiere decir que el cuartil 1 se encuentra
entre el dato 13 y el 14 mientras que el cuartil
3 esta entre el dato 37 y 38.
62(No Transcript)
63OTRA MEDIDA DE DISPERSION
- El Rango Intercuartil es otra medida de
dispersion utilizada para poder determinar el
rango de valores en el que se encuentra el 50 de
los datos, excluyendo el 50 que se encuentre en
los extremos, es decir, 25 en el extremo
superior y 25 en el extremo inferior.
64RANGO INTERCUARTIL
- El rango intercuartil es la diferencia entre el
cuartil 3 y el cuartil 1 - RI Q3 - Q1
65EJEMPLO
- Para las maquinas llenadoras
- Maquina 1
- 365.75 - 343.25
- 22.5
- Maquina 2
- 343 - 337
- 6
66DIAGRAMA DE CAJAS
- Esta es una herramienta sumamente util para
comparar distintos grupos de datos, ya que
permite ver en una sola grafica, la tendencia
central y la dispersion, asi como detectar datos
atipicos o sospechosos.
67EJEMPLO
68PASOS PARA CONSTRUIR UN DIAGRAMA DE CAJAS
- Calcular los cuartiles 1,2 y 3.
- Graficar una linea para cada uno de los
cuartiles. La caja queda definida por el rango
intercuartil y la linea dentro de la caja
identifica la mediana. - Calcular el rango intercuartil (Q3 - Q1) al que
se denomina RI. - Calcular dos valores Valor Adyacente Superior y
Valor Adyacente Inferior (VAS y VAI).
69- Estos valores se calculan de la siguiente manera
- VAS Q3 1.5RI
- VAI Q1 - 1.5RI
- Luego, encontrar en los datos dos valores m y M
tal que - m max(Xi Xi lt VAS)
- M min(Xi Xi gt VAI)
- Estos valores se grafican como los limites de los
alambres que nos sirven para identificar datos
atipicos del conjunto de datos.
70EJEMPLO
71(No Transcript)
72PARETO
- Forma de separar los pocos vitales de los muchos
triviales, que significa en esencia analizar la
causas y efectos que constituyen en el 80 de un
problema y obviar el 20 que suelen ser causas
triviales. - Este enfatiza en la mayoría de los casos que
pocas causas pueden ser provocadoras del 80 de
efectos de un problema.
73Ejemplo Se presenta a continuación una tabla
con las causas a las que se atribuye el bajo
rendimiento de los alumnos en los programas de
maestria que imparte FISICC. Construya un
diagrama de pareto para identificar cuales son
los principales problemas que afrontan los
estudiantes.
74(No Transcript)
75(No Transcript)
76APLICACIONES DE LAS MEDIDAS DE TENDENCIA CENTRAL
Y DISPERSION
Cuál es la clase más homogénea? En cuál espera
que existan menos alumnos que pierdan la
clase? En cuál parece que hay más
problemas? Comparando las clases A,B y D, En
cuál seguramente hay notas más altas?
77(No Transcript)
78Problema Exámenes de curso
Cuál cree Ud. Que fue el examen más
difícil? Cuál cree Ud. Que fue el más fácil?
79MEDIDAS DE FORMA
- Las medidas de forma sirven para darnos una idea
respecto a la simetria y la agudez de la
distribucion de los datos. Las medidas de forma
mas importantes son - Sesgo
- Curtosis
80SESGO
Si el resultado es positivo esta sesgada a la
derecha Si el resultado es negativo esta sesgada
a la izquierda
OTRAS FORMULAS
81Curtosis
- También se le denomina grado de agudez, y es el
grado de apuntamiento de una distribución. - Existen 3 tipos
- Normal o mesocurticaDistribución no muy
apuntalada ni achatada, o sea normal. - Leptocurtica Tiene apuntamiento.
- Platicúrtica Más achatada que la Normal.
82(No Transcript)
83AGRUPACION DE DATOS
- Rango Dato mayor -Dato menor
- Número de clases (K)
- K 1 3.3. Log N (usar entre 3 y 12 intervalos
como máximo) - Intervalos de clase (i)
- i Rango/K
- Número de observaciones y número
- de celdas recomendado
- De 20 - 50 6 celdas
- De 51 - 100 7 celdas
- De 101 - 200 8 Celdas
- De 201 - 500 9 Celdas
- De 501 - 1000 10 celdas
- De 1000 en adelante 11 a 15 celdas
84MEDIANA
Lri Limite inferior de la celda donde esta
la mediana n Número total de
observaciones Fa Frecuencia acumulativa
anterior a la celda donde esta la
mediana FMe Frecuencia de la celda de la
mediana i Ancho del intervalo de la celda.
85MODA
Lri Limite inferior de la clase modal
Diferencia con la clase anterior
Diferencia con la clase posterior i Ancho
del intervalo de la celda.
86Calculo de Medidas de Tendencia Central
87(No Transcript)
88Cálculo de la MODA
Cálculo de la Mediana
89(No Transcript)
90(No Transcript)
91(No Transcript)
92(No Transcript)
93(No Transcript)
94(No Transcript)
95EJEMPLO Con los datos del problema anterior,
encuentre a) varianza (s2), b) desviación típica
(s), c) desviación estándar (s), d) coeficiente
de variación (V).
96(No Transcript)
97Ejemplos de uso de la Desviación típica, y
Varianza
98MOMENTOS
- Se utilizan para producir valores que sirven el
cálculo de las medidas de asimetría y agudez. - Existen de 3 clases
- Con respecto del origen
- Con respecto a la media.
- Con respecto a cualquier punto.
99Datos no agrupados
- Respecto al origen
- Respecto a la media
- Con respecto a cualquier punto.
100Datos agrupados
101Coeficiente de asimetríaDado en función del
momento 3
Asimetria positiva 0 Simétrica -Asimetria
negativa.
102METODO DE OCHO PASOSPARA RESOLVER PROBLEMAS
UNA PERSONA VALIENTE NO ES EL QUE NO TIENE
MIEDO, SINO AQUEL QUE A PESAR DEL TEMOR
LO SUPERA Y SE ENFRENTA A SUS PROBLEMAS
103Los problemas nunca se acaban
Pero todo en la vida tiene solución y los
problemas empresariales no son la excepción. Sin
embargo, hay que saberlos tratar para que se
resuelvan de manera efectiva y, de ser posible,
para siempre.
Mil cortes en las hojas del árbol del mal
equivalen a uno sólo en las raíces Thoreau
104Qué es un problema?
SITUACIÓN EN DONDE EL RENDIMIENTO O
COMPORTAMIENTO DE UN SISTEMA NO SA- TISFACE LAS
EXPECTATIVAS. En general, podríamos decir que
existe un problema cuando algo no ofrece el
resultado que esperamos.
105Los ocho pasos
- Definición del problema
- Acción momentánea
- Definición del origen
- Acción correctiva definitiva
- Comprobación
- Estandarización
- Documentación
- Conclusiones
1061. Definición del problema
A) El tiempo en que ocurre B) El tipo de
problema C) El síntoma presentado D) Aspectos
circunstanciales E) Incluir información que no
pueda ser presentada en forma de datos
(gráficas y diagramas) F) Considerar cuándo,
cuánto, qué, quién, dónde, etcétera)
1072. Acción momentánea
Es la acción para solucionar el problema
temporalmente y así garantizar que, a pesar de
que el problema existe, éste no va a afectar al
cliente. Busque una acción momentánea a realizar
para cada problema mientras lo resuelve de forma
definitiva.
1083. Definición del origen del problema
Definir dónde exactamente se originó un problema
es la clave para encontrar la solución más
acertada. A) Generar lluvia de ideas Un
mismo problema puede ser visualizado de
muy distintas maneras por diferentes
personas. Importante Debe realizarse en un
clima de amistad. Todas las ideas son
importantes. B) Elaborar diagrama
de causa-efecto (Ishikawa) Relación entre un
problema o resultado y las causas que lo
ocasionaron.
109Construcción de un diagrama de causa-efecto
1) Definir el problema 2) Identificar las
causas mayores ayudados por una lluvia de
ideas. 3) Identificar las subcausas. 4)
Ponderar las causas antes de evaluarlas 5)
Evaluar las causas más probables 6) Tomar una
solución.
110Diagrama de causa-efecto
R.R. H.H.
EQUIPO
LIDERAZGO
DESUNION
EQUIPO DE COMPUTO
OPORTUNIDAD
RESPONSABILIDAD
IDENTIFICACION CON LA INSTITUCION
DESIGUALDAD
TELEFONOS
CONFIANZA
REL. INTERNAS
COMUNICACIÓN INADECUADA
ACTITUD
CARGAS
AUTORIDAD RIGIDA
TRABAJO
EXCESO DE PERSONAS
DECISIONES
TIEMPOS
CLARIDAD
RIGIDEZ
VENTILACION
PROCESOS
ESPACIO
INFORMACION
DEFINICIÓN
REDUCIDO
OBJETIVOS
FORMA DE TRANSMITIR
DISPONIBILIDAD
MEDIO AMBIENTE
CLAROS
METODOS
1114. Acción correctiva definitiva
A) Actividades a realizar B) Responsables C)
Involucrados D) Tiempos E) Recursos
5. Comprobación
A) Tiempo de revisión B) Frecuencia C)
Responsable
6. Estandarización
Los cambios deberán establecerse de manera
formal para asegurar su correcta aplicación
en adelante.
1127. Documentación
Recopilar toda la información, hechos,
decisiones, etcétera, que se llevaron a cabo
desde que apareció el problema hasta su solución
definitiva.
8. Conclusiones
Aunque el problema resuelto sea el mismo, la
experiencias de cada una de las personas es
diferente cada quien ve el problema desde su
propia perspectiva. Compartir experiencias es una
forma de aprendizaje muy enriquecedora.
113Probabilidad
- Posibilidad de que algo llegue a suceder
- Frecuencia de un evento dentro de un todo
(población). - P (NA/N)
- Donde
- NA de veces que ocurre el evento A
- N total de posibles resultados.
114FORMULAS
- P(AUB) P(A) P(B) , para sucesos mutuamente
excluyentes (Si uno sucede es imposible que el
otro se produzca). - P(AUB) P(A) P(B) - P(A B)
- Para eventos no mutuamente excluyentes.
- Si A y B son eventos independientes
- P(A B) P(A)P(B)
- Si los sucesos son dependientes
- P(A B) P(A)P(B/A)
115PERMUTACION
- Es una disposición ordenada de un conjunto de
objetos.
COMBINACION
- Si la forma como se ordenan es irrelevante
entonces se le llama combinación, (no importa el
orden)
116DISTRIBUCIONES DE PROBABILIDAD Y FRECUENCIA
- Experimento En estadistica, se denomina
experimento a cualquier actividad que se realice
con el fin de comprobar una hipotesis. - Evento Es el resultado de un experimento.
117Variables Aleatorias
- Es aquella que toma valores diferentes como
resultado de un experimento aleatorio - TIPOS
- DISCRETA toma valores puntuales en una escala de
medicion. - CONTINUA Puede tomar cualquier valor dentro de
una escala de medicion o de valores.
VALOR ESPERADO DE UNA VARIABLE ALEATORIA
- Es un promedio pesado del valor de cada resultado
posible multiplicado por la probabilidad de dicho
resultado
118DISTRIBUCIONES DE PROBABILIDADES
- Están relacionadas con las distribuciones de
frecuencias, generalmente se piensa como una
distribución de frecuencia teórica cuando se
habla de distribución de probabilidades. - TIPOS
- DISCRETAS Cuando los datos y la variable toma
números limitados de valores. - CONTINUAS Cuando los datos y la variable (toma
valores en un rango a utilizar) y la población se
puede decir que es muy grande (infinita)
- DISTRIBUCIONES DISCRETAS
- Entre las funciones de distribución de
probabilidades que más utilizamos están - HIPERGEOMETICA
- BINOMIAL
- POISSON
119LA DISTRIBUCION BINOMIAL
HIPERGEOMETICA
- Se utiliza cuando la muestra de la población es
finita y se toma la muestra sin reemplazo - Para fines de la carrera es muy poco utilizado.
- Se utiliza en probabilidad discreta, cuyo número
de elementos es infinito, es usada cuando tenemos
atributos, ejemplo aceptable, no aceptable,
éxito o fracaso, falla o no falla, etc. - Esta describe resultados de un proceso de
Bernoulli (este proceso dice que las
probabilidades solo pueden ser p éxito, cara,
etc - q1-p, lo contrario de p. La probabilidad de
este evento permanece fijo respecto al tiempo. - Los eventos son estadísticamente independientes.
120Formula de la Binomial
- P(Probabilidad de r éxitos en n ensayos)
- p probabilidad de tener éxito
- q probabilidad de no tener éxito
- r de éxitos deseados
- n de intentos hechos.
121DISTRIBUCION DE POISSON
- Se utiliza en probabilidad discreta, se aplica a
diversas situaciones que aplican la realización
de observaciones por unidad de tiempo. Ejemplo
contar el número de vehículos que llegan a una
caseta de control, contar el número de máquinas
descompuestas durante 1 día, distribución de
llamadas telefónicas que llegan a un conmutador,
la demanda de pacientes que necesitan servicios,
etc.
CARACTERISTICAS
- Con el ejemplo del número de vehículos que pasan
por una sola caja de una caseta de cobro, daremos
las características - La media del número de vehículos que llegan por
hora pico puede estimarse a partir de datos sobre
tráfico que se tengan disponibles. - Si dividimos la hora pico en períodos
(intervalos) de un segundo cada uno,
encontraremos las siguientes afirmaciones - A) La probabilidad de que exactamente un vehículo
llegue a una caja por segundo es muy pequeño.
122FORMULA
- B) La probabilidad de que dos o más vehículos
lleguen en un intervalo de un segundo es muy
pequeña. - C) El número de vehículos que llegan a un
intervalo dado de un segundo es independiente de
que dicho intervalo se presente en la hora pico. - El número de llegadas en cualquier intervalo de
un segundo no depende del número de llegadas en
cualquier otro intervalo de un segundo.
Donde Número medio de presentaciones por
intervalos de tiempo. X Valor de variable.
123FUNCIONES CONTINUAS
- La más utilizada es la Normal y es sobre la cual
esta soportada muchas aplicaciones. - Definimos
- Donde
- xi Dato
- Media
124ANALISIS DE REGRESION Y CORRELACION
- ANALISIS DE REGRESION
- El término regresión, se uso por primera vez
como un concepto estadístico por Sir Francis
Galton. Galton hizo un estudio que mostró que,
la altura de los niños de los padres altos tiende
a bajarse, o "regresar", hacia la altura media de
la población. El designó la palabra "regresión"
como el nombre del proceso general de predecir
una variable (la altura de los niños), a partir
de otra (la altura de los padres). - Posteriormente, los estadísticos usaron el
término regresión múltiple para describir el
proceso mediante el cual se usan varias variables
para predecir otra. - En el análisis de regresión, se desarrollará una
ecuación de estimación, es decir, una fórmula
matemática que relaciona las variables conocidas
con la variable desconocida
125- TIPOS DE RELACIONES DE CURVAS DE REGRESION
- Los análisis de regresión y correlación, están
basados en la relación o asociación entre dos o
más variables. La variable conocida es llamada
variable independiente. La variable que se está
tratando de predecir es la variable dependiente. - REGRESION LINEAL
- La ecuación de la relación lineal es
- Y ao a1X
- Donde ao a1 son parámetros estadísticos que se
deben calcular.
126- METODO DE MINIMOS CUADRADOS
- Consideremos los puntos representados por
(X1,Y1), (X2,Y2), ..., (Xn,Yn). Para un valor de
Xi, existirá una diferencia Di entre Yi y el
valor que da la ecuación de ajuste. Cada
diferencia Di, se conoce como desviación, error o
residuo la cual, puede ser positiva, negativa o
cero. - De todas las curvas de aproximación a una serie
de datos puntuales, la curva que tiene la
propiedad de que - D12 D22 ... DN2 es mínimo
- se conoce como la mejor curva de ajuste. Así una
recta con esta propiedad se llama recta de
mínimos cuadrados y tiene la ecuación
- Y ao a1X
- donde las constantes ao y a1 se determinan
mediante el sistema de ecuaciones simultáneas - S Y ao (N) a1 (S X)
- S XY ao (S X) a1 (S X2)
- que son llamadas ecuaciones normales para la
recta de mínimos cuadrados. - Si se resuelve el sistema en forma general,
entonces se obtienen las siguientes fórmulas
127Formulas para calcular los valores
128- CORRELACION
- La correlación, es el grado de relación que
existe entre las variables, y un análisis de
correlación determina en que medida una ecuación
lineal o de otro tipo describe o explica de una
forma adecuada la relación entre las dos
variables. - Si todos los valores de las variables satisfacen
exactamente una ecuación, se dice que las
variables están correlacionadas perfectamente o
que hay correlación perfecta entre ellas. Así
las áreas "A" y los radios "r" de todos los
círculos están correlacionados perfectamente,
puesto que A p r2. Las variables altura y
peso de los individuos muestran cierta
correlación.
- CORRELACION LINEAL
- Consideremos el diagrama de dispersión de la
figura 4.3, si "Y" tiende a incrementarse cuando
"X" aumenta, como en (a), la correlación se dice
positiva o correlación directa. Si "Y" tiende a
disminuir cuando se incrementa "X", como en (b),
la correlación se dice negativa o correlación
inversa. Si no hay ninguna relación entre las
variables, como en (c), se dice que no hay
correlación entre ellas, es decir, no están
correlacionadas.
129- COEFICIENTE DE CORRELACION LINEAL
- Si se supone una relación lineal entre las dos
variables, el coeficiente de correlación se
calcula como - Donde r esta en el rango entre -1 y 1, si
- r1 se dice que es una buena correlación y si
r0, no hay correlación
130COEFICIENTE DE DETERMINACION Al cuadrado del
coeficiente de correlacion se le denomina
coeficiente de determinacion. Aunque el mas
utilizado es el coeficiente de correlacion, es el
coeficiente de determinacion el que tiene un
significado mas concreto. El coeficiente de
determinacion representa la fraccion (o el
porcentaje) de la variacion de y que es
explicada por la variacion de x. Por ejemplo,
si obtenemos un coeficiente de correlacion de
0.95 y lo elevamos al cuadrado obtenemos 0.9025,
es decir que la variacion de la variable
independiente (x) explica el 90.25 de la
variacion de la variable dependiente (y). El
otro 10 de la variacion de y es atribuible a
otras causas que pueden incidir en dicha variable.
131- EJEMPLO
- Los siguientes datos son las mediciones de
velocidad del aire y del coeficiente de
evaporación de las gotitas de combustible en una
turbina de propulsión. - Velocidad del aire Coeficiente de
evaporación - X (cm/seg) Y
(mm2/seg) -
- 20
0.18 - 60
0.37 - 100
0.35 - 140
0.78 - 180
0.56 - 220
0.75 - 260
1.18 - 300
1.36 - 340
1.17 - 380
1.65
- Encuentre
- a) la ecuación de la recta de mínimos cuadrados,
- b) utilice la ecuación anterior, para estimar el
coeficiente de evaporación de una gotita
cuando la velocidad del aire es de 190 cm/seg, - c) coeficiente de correlación.
132- SOLUCION
- a) Recta de regresión "Y" sobre "X"
- X Y X2
Y2 XY -
- 20 0.18 400 0.0324
3.6 - 60 0.37 3,600 0.1369
22.2 - 100 0.35 10,000 0.1225
35.0 - 140 0.78 19,600 0.6084
109.2 - 180 0.56 32,400 0.3136
100.8 - 220 0.75 48,400 0.5625
165.0 - 260 1.18 67,600 1.3924
306.8 - 300 1.36 90,000 1.8496
408.0 - 340 1.17 115,600 1.3689
397.8 - 380 1.65 144,400 2.7225
627.0 -
- 2,000 8.35 532,000 9.1097
2,175.4
133- N 10 datos
- S X 2,000 S X2 532,000
- S Y 8.35 S XY 2,175.40
- Sustituyendo en las ecuaciones normales
- S Y ao N a1 S X
- S XY ao S X a1 S X2
- 8.35 ao 10 a1 2,000 (1)
- 2,175.40 ao 2,000 a1 532,000 (2)
- Resolviendo las ecuaciones (1) y (2) en forma
simultánea tenemos - ao 0.069 a1 0.0038,
- sustituyendo en Y ao a1 X, obtenemos la
ecuación de la recta de regresión de "Y" sobre
"X" - Y 0.069 0.0038 X (3)
- b) para X 190 el coeficiente de evaporación
será - Y 0.069 0.0038(190) 0.79
- Y 0.79 mm2/seg
134- c) el coeficiente de correlación es
- r 10(2,175.40) - (2,000)(8.35)
0.95 - Ö 10(532,000)-(2,000)210(9.1097) -
(8.35)2 - El valor del coeficiente de correlación nos
indica - que la correlación es positiva, debido al signo
del coeficiente, - que la relación entre X Y es bastante buena,
ya que el coeficiente es bastante cercano a 1,
en valor absoluto, - cuando el coeficiente es bastante cercano a
cero, se dice que no hay correlación entre las
variables X Y.
135- d) el coeficiente de determinacion es
- r2 0.95 2 0.9025 equivalente a 90.25
- El valor del coeficiente de determinacion nos
indica - Que podemos atribuir en un 90.25 la variacion
de Y a la variacion de X y un 9.75 de la
variacion es atribuible a otros factores que no
fueron considerados en el modelo matematico. - Cuando el porcentaje es bajo, digamos abajo del
80, debemos escoger otra variable independiente
o agregar una variable mas al modelo y realizar
un analisis de regresion multiple.
136CURVE EXPERT
- Es uno de tantos programas disponibles para
realizar analisis de regresion y correlacion.
Tiene la ventaja de tener predetermina-dos una
gran cantidad de modelos, aparte de los que el
usuario quiera definir. Es un Shareware que se
encuentra disponible en internet.