ESTAD - PowerPoint PPT Presentation

About This Presentation
Title:

ESTAD

Description:

estad stica para la administraci n – PowerPoint PPT presentation

Number of Views:164
Avg rating:3.0/5.0
Slides: 137
Provided by: UNIVERS220
Category:

less

Transcript and Presenter's Notes

Title: ESTAD


1
ESTADÍSTICA PARA LA ADMINISTRACIÓN
2
Introducción a la Estadística
  • La palabra estadística tiene 2 significados
  • Estadística 1 hechos numéricos sistemáticamente
    recolectados 2 Ciencia de recolectar, clasificar
    y utilizar estadísticas
  • (Oxford Concise Dictionary)
  • Por ejemplo.

3
Algunas definiciones de Estadistica.
  • Rama de las matemáticas que proporciona
    herramientas que permiten manejar grandes
    cantidades de datos, convirtiendolos en
    información útil.
  • Forma de decir mentiras con fundamentos
    matemáticos.

4
DEFINICION
  • Es una ciencia, pues aplica el Método Científico
    al ocuparse de la recolección, organización,
    análisis, interpretación y presentación de datos,
    tanto para la deducción de conclusiones como para
    la toma de decisiones razonables de acuerdo a
    tales análisis.

5
Introducción (cont.)
  • La ciencia de la Estadística utiliza
  • matemáticas (teoría de probabilidades)
  • ciencia de las computadoras (graficos and
    simulaciones)
  • filosofía
  • Qué distingue a la Estadística de las
    matemáticas?
  • La estadística hace uso de las matemáticas

6
Introducción (cont.)
  • La Estadística enfatiza la VARIABILIDAD NATURAL
  • De individuos (personas, plantas, ratas, ovejas,
    bombillas de luz, precios de acciones, etc).
  • La Estadística es utilizada por
  • científicos
  • biólogos
  • químicos
  • físicos
  • psicólogos
  • economistas

7
Introducción (cont.)
  • La Estadística se usa para
  • Informar al publico
  • Proveer comparaciones
  • Explicar resultados
  • Influenciar decisiones
  • Justificar un reclamo o afirmación
  • Predecir futuros resultados
  • Establecer una relación o asociación
  • Estimar cantidades desconocidas

8
Introducción (cont.)
  • Los Estadísticos (personas que estudian la
    estadística)
  • Entienden la idea de la variabilidad de los
    individuos
  • Se toman el tiempo siendo lógicos, profundos e
    imparciales cuando preparan resultados y reportes
  • Se cuidan de no sacar conclusiones que están
    fuera de los límites de la pregunta que debe
    responderse mediante la estadística

9
  • UNIDAD DE ESTUDIO Es el elemento mas pequeno al
    que podemos hacer referencia en un estudio
    estadistico.
  • COLECTIVO Es todo conjunto compuesto por mas de
    una unidad de estudio un colectivo puede ser
    una MUESTRA o una POBLACION.

10
Datos
  • Datos son piezas de información
  • Varias piezas de datos forman un conjunto de
    datos
  • Los Datos se componen de los objetos que han
    sido medidos (eg personas, arboles, ratas) y los
    atributos que fueron registrados (edad, tamaño,
    ph, costo, peso, etc)
  • objetos son aka sujetos, casos, entidades, etc
  • Atributos son aka caracteristicas, variables,
    factores, etc

11
Variables
  • Cuando medimos los atributos de un objeto,
    obtenemos un valor que varía entre objetos. Por
    ejemplo considere las personas en esta clase como
    objetos y su estatura como el atributo
  • El atributo altura varía entre objetos, de ahí
    que los atributos son mas colectivamente
    conocidos como variables

12
TIPOS DE VARIABLES
  • DISCRETAS Son aquellas que toman valores
    puntuales en una escala, ejemplo No. de unidades
    producidas, No. de quintales transportados, etc.
  • CONTINUA Son aquellas que pueden tomar
    cualquier valor real en una escala, por
    ejemploTemperatura, peso, longitud, etc.

13
Tipos de Datos
  • Las Variables pueden ser medidas en cuatro
    escalas diferentes
  • Es escencial que sea capaz de identificar las
    cuatro diferentes escalas de medición y ejemplos
    de cada una

14
1 Escala Nominal de Medición
  • Los datos son medidos al nivel nominal donde cada
    caso es clasificado en una de un numero discreto
    de categorías
  • EG Color, Partido Politico, Genero, etc

15
2 Escala Ordinal de Medición
  • Los datos son medidos en una escala ordinal si
    las categorías implican orden
  • EG Rango Militar, Talla de ropa, etc
  • La diferencia entre rangos es consistente en
    dirección, pero no en magnitud.

16
3 Escala de medición de Intervalo
  • Si las diferencias entre los valores tienen
    significado, los datos son medidos en la escala
    de Intervalo.
  • La temperatura es el mejor ejemplo

17
4 Escala de medición de Ratio (rata)
  • Los datos medidos en una escala de ratio tienen
    diferencias que son significativas, y relativas a
    algun punto real de origen o cero.
  • eg Peso, Altura, edad, etc
  • Esta es la escala más común de medición.

18
Tipos de Datos (Cont.)
  • Datos de tipo Ordinal, Intervalo y Ratio también
    se conocen como datos Cuantitativos
  • Datos de tipo Nominal también son denominados
    datos Cualitativos

19
Dos tipos de Estadística
  • Estadística Descriptiva
  • métodos de resumir grandes cantidades de datos en
    una forma conveniente
  • Estadística Inferencial
  • Métodos para extraer conclusiones (hacer
    inferencias) respecto a las características de
    una población
  • por ejemplo.

20
  • POBLACION Se le llama población o universo, al
    conjunto total de unidades de estudio que se
    desean investigar.
  • MUESTRA Es un subconjunto de una población. Se
    utiliza cuando la población es muy numerosa,
    infinita o muy difícil de examinar.
  • MUESTRA ALEATORIA Es cuando cada elemento tiene
    la misma oportunidad de ser escogido.
  • Muestreo aleatorio estratificado
  • Muestreo aleatorio sistematico

21
Poblaciones
  • Un componente esencial de entender la ciencia de
    la estadística es entender estos términos
  • La población consiste en el conjunto de todas las
    mediciones en que el investigador está interesado
  • Un número que describe una población se denomina
    un parametro
  • por ejemplo...

22
Muestras
  • Una muestra es un subconjunto de datos de la
    población
  • Un numero que describe una muestra es un
    estadístico
  • por ejemplo...

23
Inferencia
  • Si tomamos una muestra y calculamos un
    estadístico, utilizamos ese estadístico para
    inferir algo respecto a la población de la cual
    la muestra fue extraída.
  • EG Comunmente, las muestras son utilizadas para
    inferir respecto a
  • Resultados de Elecciones
  • Preferencias del consumidor
  • Actitudes hacia aspectos sociales
  • Se le ocurre algún otro ?????

24
CONTENIDO
  • Estadistica Descriptiva
  • Regresion y Correlacion
  • Distribuciones
  • Control Estadistico de Procesos

25
  • ESTADISTICA DESCRIPTIVA
  • Es la parte de la Estadística que trata
    solamente de describir y analizar un colectivo,
    sin sacar conclusiones o inferencias de un
    colectivo mayor, a partir de ella.
  • La Estadística descriptiva incluye las técnicas
    que se relacionan con el resumen y la descripción
    de datos. Estos datos pueden ser representados
    en forma gráfica y pueden incluir análisis por
    computadora.

26
ESTADISTICA DESCRIPTIVA
  • MEDIDAS DE TENDENCIA CENTRAL
  • MEDIDAS DE DISPERSION
  • MEDIDAS DE ORDEN
  • MEDIDAS DE FORMA
  • REPRESENTACION GRAFICA

27
MEDIDAS DE TENDENCIA CENTRAL
  • MEDIA (ARITMETICA O PONDERADA)
  • MODA
  • MEDIANA

28
MEDIDAS DE DISPERSIÓN
  • Rango
  • Desviacion Media
  • Varianza
  • Desviación Típica o standard

29
MEDIDAS DE ORDEN
  • Cuartiles
  • Deciles
  • Percentiles

30
MEDIDAS DE FORMA
  • Sesgo
  • Curtosis
  • Momentos

31
REPRESENTACION GRAFICA
  • Histograma de frecuencias
  • Diagrama de Pareto
  • Ojiva de Frecuencias Acumuladas
  • Diagrama de Pastel
  • Diagrama de Cajas
  • Diagrama de Tallos y Hojas

32
MEDIA ARITMETICA
33
EJEMPLO
34
MEDIAPONDERADA
35
EJEMPLO
36
Mediana
  • Valor que divide la serie de datos en dos partes
    iguales.
  • Si el numero de datos es impar, es el valor que
    está situado justo en medio.
  • Si el número de datos es par, es el promedio
    aritmético de los dos datos de en medio.

37
EJEMPLO
38
Moda
  • Es el valor que mas se repite en un conjunto de
    datos.
  • Puede no existir o puede existir mas de uno.

39
EJEMPLO
40
(No Transcript)
41
EJEMPLO
42
(No Transcript)
43
EJEMPLO
44
(No Transcript)
45
EJEMPLO
46
(No Transcript)
47
RESULTADO DEL PROCESO DE LLENADO INDUSTRIAL DE
REFRESCOS (en ml)
48
DATOS ORDENADOS
49
MEDIDAS DE TENDENCIA CENTRAL
50
MEDIDAS DE DISPERSION
51
CONSTRUCCION DE UNA TABLA DE FRECUENCIAS
52
TABLA DE FRECUENCIAS
53
(No Transcript)
54
HISTOGRAMA DE FRECUENCIAS
55
(No Transcript)
56
MEDIDAS DE ORDEN
  • Son aquellas que nos permiten ubicar un dato de
    acuerdo a la posicion que ocupa dentro de la
    serie de datos.
  • Nos permiten ordenar, clasificar y categorizar
    los datos.
  • Tambien se conocen como fractilos porque dividen
    los datos en partes iguales.

57
FRACTILOS
  • De acuerdo al numero de partes en que se dividan
    los datos los fractilos pueden ser
  • Cuartiles si dividen a los datos en cuatro
    partes iguales.
  • Deciles si dividen a los datos en diez partes
    iguales.
  • Percentiles o Centiles si dividen a los datos en
    cien partes iguales.

58
FRACTILOS cont...
  • Por ejemplo, los cuartiles dividen la
    distribucion de datos en cuatro partes iguales,
    cada una conteniendo el 25 de los datos.
  • De lo anterior se deduce que, como se dijo
    anteriormente, si la mediana divide los datos en
    dos partes iguales, debe ser igual al cuartil 2,
    al decil 5 y al percentil 50.

59
FRACTILOS cont...
  • Forma de calculo
  • D de partes en que vamos a dividir los
    datos (para cuartiles 4, para deciles 10, para
    percentiles 100).
  • F del fractilo a calcular, es decir, si
    queremos calcular el tercer cuartil, F es igual a
    3, si queremos calcular el sexto decil, F es
    igual a 6, etc.
  • N de datos en la distribucion.

60
FRACTILES cont...
  • Entonces, la posicion del fractilo esta dada por
  • FN (D-F)
    D
  • Ejemplo Para calcular el cuartil 3 de 50 datos
  • 350 (4-3) 4
  • 37.75, es decir que el tercer cuartil esta
    ubicado entre el dato 37 y el 38, a un 75 de la
    distancia entre ambos datos.

61
EJEMPLO
  • Para continuar con el ejemplo de las dos maquinas
    llenadoras, vamos a calcular los cuartiles 1 y 3
    para cada maquina, entonces
  • D 4
  • N 50
  • F 1 y 3
  • 150 (4-1) 4
  • 13.25 para el cuartil 1
  • 350 (4-3) 4
  • 37.75 para el cuartil 3
  • Esto quiere decir que el cuartil 1 se encuentra
    entre el dato 13 y el 14 mientras que el cuartil
    3 esta entre el dato 37 y 38.

62
(No Transcript)
63
OTRA MEDIDA DE DISPERSION
  • El Rango Intercuartil es otra medida de
    dispersion utilizada para poder determinar el
    rango de valores en el que se encuentra el 50 de
    los datos, excluyendo el 50 que se encuentre en
    los extremos, es decir, 25 en el extremo
    superior y 25 en el extremo inferior.

64
RANGO INTERCUARTIL
  • El rango intercuartil es la diferencia entre el
    cuartil 3 y el cuartil 1
  • RI Q3 - Q1

65
EJEMPLO
  • Para las maquinas llenadoras
  • Maquina 1
  • 365.75 - 343.25
  • 22.5
  • Maquina 2
  • 343 - 337
  • 6

66
DIAGRAMA DE CAJAS
  • Esta es una herramienta sumamente util para
    comparar distintos grupos de datos, ya que
    permite ver en una sola grafica, la tendencia
    central y la dispersion, asi como detectar datos
    atipicos o sospechosos.

67
EJEMPLO
68
PASOS PARA CONSTRUIR UN DIAGRAMA DE CAJAS
  • Calcular los cuartiles 1,2 y 3.
  • Graficar una linea para cada uno de los
    cuartiles. La caja queda definida por el rango
    intercuartil y la linea dentro de la caja
    identifica la mediana.
  • Calcular el rango intercuartil (Q3 - Q1) al que
    se denomina RI.
  • Calcular dos valores Valor Adyacente Superior y
    Valor Adyacente Inferior (VAS y VAI).

69
  • Estos valores se calculan de la siguiente manera
  • VAS Q3 1.5RI
  • VAI Q1 - 1.5RI
  • Luego, encontrar en los datos dos valores m y M
    tal que
  • m max(Xi Xi lt VAS)
  • M min(Xi Xi gt VAI)
  • Estos valores se grafican como los limites de los
    alambres que nos sirven para identificar datos
    atipicos del conjunto de datos.

70
EJEMPLO
71
(No Transcript)
72
PARETO
  • Forma de separar los pocos vitales de los muchos
    triviales, que significa en esencia analizar la
    causas y efectos que constituyen en el 80 de un
    problema y obviar el 20 que suelen ser causas
    triviales.
  • Este enfatiza en la mayoría de los casos que
    pocas causas pueden ser provocadoras del 80 de
    efectos de un problema.

73
Ejemplo Se presenta a continuación una tabla
con las causas a las que se atribuye el bajo
rendimiento de los alumnos en los programas de
maestria que imparte FISICC. Construya un
diagrama de pareto para identificar cuales son
los principales problemas que afrontan los
estudiantes.
74
(No Transcript)
75
(No Transcript)
76
APLICACIONES DE LAS MEDIDAS DE TENDENCIA CENTRAL
Y DISPERSION
Cuál es la clase más homogénea? En cuál espera
que existan menos alumnos que pierdan la
clase? En cuál parece que hay más
problemas? Comparando las clases A,B y D, En
cuál seguramente hay notas más altas?
77
(No Transcript)
78
Problema Exámenes de curso
Cuál cree Ud. Que fue el examen más
difícil? Cuál cree Ud. Que fue el más fácil?
79
MEDIDAS DE FORMA
  • Las medidas de forma sirven para darnos una idea
    respecto a la simetria y la agudez de la
    distribucion de los datos. Las medidas de forma
    mas importantes son
  • Sesgo
  • Curtosis

80
SESGO
Si el resultado es positivo esta sesgada a la
derecha Si el resultado es negativo esta sesgada
a la izquierda
OTRAS FORMULAS
  • 3(MEDIA - MEDIANA)
  • SESGO

81
Curtosis
  • También se le denomina grado de agudez, y es el
    grado de apuntamiento de una distribución.
  • Existen 3 tipos
  • Normal o mesocurticaDistribución no muy
    apuntalada ni achatada, o sea normal.
  • Leptocurtica Tiene apuntamiento.
  • Platicúrtica Más achatada que la Normal.

82
(No Transcript)
83
AGRUPACION DE DATOS
  • Rango Dato mayor -Dato menor
  • Número de clases (K)
  • K 1 3.3. Log N (usar entre 3 y 12 intervalos
    como máximo)
  • Intervalos de clase (i)
  • i Rango/K
  • Número de observaciones y número
  • de celdas recomendado
  • De 20 - 50 6 celdas
  • De 51 - 100 7 celdas
  • De 101 - 200 8 Celdas
  • De 201 - 500 9 Celdas
  • De 501 - 1000 10 celdas
  • De 1000 en adelante 11 a 15 celdas

84
MEDIANA
Lri Limite inferior de la celda donde esta
la mediana n Número total de
observaciones Fa Frecuencia acumulativa
anterior a la celda donde esta la
mediana FMe Frecuencia de la celda de la
mediana i Ancho del intervalo de la celda.
85
MODA
Lri Limite inferior de la clase modal
Diferencia con la clase anterior
Diferencia con la clase posterior i Ancho
del intervalo de la celda.
86
Calculo de Medidas de Tendencia Central
87
(No Transcript)
88
Cálculo de la MODA
Cálculo de la Mediana
89
(No Transcript)
90
(No Transcript)
91
(No Transcript)
92
(No Transcript)
93
(No Transcript)
94
(No Transcript)
95
EJEMPLO Con los datos del problema anterior,
encuentre a) varianza (s2), b) desviación típica
(s), c) desviación estándar (s), d) coeficiente
de variación (V).
96
(No Transcript)
97
Ejemplos de uso de la Desviación típica, y
Varianza
98
MOMENTOS
  • Se utilizan para producir valores que sirven el
    cálculo de las medidas de asimetría y agudez.
  • Existen de 3 clases
  • Con respecto del origen
  • Con respecto a la media.
  • Con respecto a cualquier punto.

99
Datos no agrupados
  • Respecto al origen
  • Respecto a la media
  • Con respecto a cualquier punto.

100
Datos agrupados
101
Coeficiente de asimetríaDado en función del
momento 3
Asimetria positiva 0 Simétrica -Asimetria
negativa.
102
METODO DE OCHO PASOSPARA RESOLVER PROBLEMAS
UNA PERSONA VALIENTE NO ES EL QUE NO TIENE
MIEDO, SINO AQUEL QUE A PESAR DEL TEMOR
LO SUPERA Y SE ENFRENTA A SUS PROBLEMAS
103
Los problemas nunca se acaban
Pero todo en la vida tiene solución y los
problemas empresariales no son la excepción. Sin
embargo, hay que saberlos tratar para que se
resuelvan de manera efectiva y, de ser posible,
para siempre.
Mil cortes en las hojas del árbol del mal
equivalen a uno sólo en las raíces Thoreau
104
Qué es un problema?
SITUACIÓN EN DONDE EL RENDIMIENTO O
COMPORTAMIENTO DE UN SISTEMA NO SA- TISFACE LAS
EXPECTATIVAS. En general, podríamos decir que
existe un problema cuando algo no ofrece el
resultado que esperamos.
105
Los ocho pasos
  • Definición del problema
  • Acción momentánea
  • Definición del origen
  • Acción correctiva definitiva
  • Comprobación
  • Estandarización
  • Documentación
  • Conclusiones

106
1. Definición del problema
A) El tiempo en que ocurre B) El tipo de
problema C) El síntoma presentado D) Aspectos
circunstanciales E) Incluir información que no
pueda ser presentada en forma de datos
(gráficas y diagramas) F) Considerar cuándo,
cuánto, qué, quién, dónde, etcétera)
107
2. Acción momentánea
Es la acción para solucionar el problema
temporalmente y así garantizar que, a pesar de
que el problema existe, éste no va a afectar al
cliente. Busque una acción momentánea a realizar
para cada problema mientras lo resuelve de forma
definitiva.
108
3. Definición del origen del problema
Definir dónde exactamente se originó un problema
es la clave para encontrar la solución más
acertada. A) Generar lluvia de ideas Un
mismo problema puede ser visualizado de
muy distintas maneras por diferentes
personas. Importante Debe realizarse en un
clima de amistad. Todas las ideas son
importantes. B) Elaborar diagrama
de causa-efecto (Ishikawa) Relación entre un
problema o resultado y las causas que lo
ocasionaron.
109
Construcción de un diagrama de causa-efecto
1) Definir el problema 2) Identificar las
causas mayores ayudados por una lluvia de
ideas. 3) Identificar las subcausas. 4)
Ponderar las causas antes de evaluarlas 5)
Evaluar las causas más probables 6) Tomar una
solución.
110
Diagrama de causa-efecto
R.R. H.H.
EQUIPO
LIDERAZGO
DESUNION
EQUIPO DE COMPUTO
OPORTUNIDAD
RESPONSABILIDAD
IDENTIFICACION CON LA INSTITUCION
DESIGUALDAD
TELEFONOS
CONFIANZA
REL. INTERNAS
COMUNICACIÓN INADECUADA
ACTITUD
CARGAS
AUTORIDAD RIGIDA
TRABAJO
EXCESO DE PERSONAS
DECISIONES
TIEMPOS
CLARIDAD
RIGIDEZ
VENTILACION
PROCESOS
ESPACIO
INFORMACION
DEFINICIÓN
REDUCIDO
OBJETIVOS
FORMA DE TRANSMITIR
DISPONIBILIDAD
MEDIO AMBIENTE
CLAROS
METODOS
111
4. Acción correctiva definitiva
A) Actividades a realizar B) Responsables C)
Involucrados D) Tiempos E) Recursos
5. Comprobación
A) Tiempo de revisión B) Frecuencia C)
Responsable
6. Estandarización
Los cambios deberán establecerse de manera
formal para asegurar su correcta aplicación
en adelante.
112
7. Documentación
Recopilar toda la información, hechos,
decisiones, etcétera, que se llevaron a cabo
desde que apareció el problema hasta su solución
definitiva.
8. Conclusiones
Aunque el problema resuelto sea el mismo, la
experiencias de cada una de las personas es
diferente cada quien ve el problema desde su
propia perspectiva. Compartir experiencias es una
forma de aprendizaje muy enriquecedora.
113
Probabilidad
  • Posibilidad de que algo llegue a suceder
  • Frecuencia de un evento dentro de un todo
    (población).
  • P (NA/N)
  • Donde
  • NA de veces que ocurre el evento A
  • N total de posibles resultados.

114
FORMULAS
  • P(AUB) P(A) P(B) , para sucesos mutuamente
    excluyentes (Si uno sucede es imposible que el
    otro se produzca).
  • P(AUB) P(A) P(B) - P(A B)
  • Para eventos no mutuamente excluyentes.
  • Si A y B son eventos independientes
  • P(A B) P(A)P(B)
  • Si los sucesos son dependientes
  • P(A B) P(A)P(B/A)

115
PERMUTACION
  • Es una disposición ordenada de un conjunto de
    objetos.

COMBINACION
  • Si la forma como se ordenan es irrelevante
    entonces se le llama combinación, (no importa el
    orden)

116
DISTRIBUCIONES DE PROBABILIDAD Y FRECUENCIA
  • Experimento En estadistica, se denomina
    experimento a cualquier actividad que se realice
    con el fin de comprobar una hipotesis.
  • Evento Es el resultado de un experimento.

117
Variables Aleatorias
  • Es aquella que toma valores diferentes como
    resultado de un experimento aleatorio
  • TIPOS
  • DISCRETA toma valores puntuales en una escala de
    medicion.
  • CONTINUA Puede tomar cualquier valor dentro de
    una escala de medicion o de valores.

VALOR ESPERADO DE UNA VARIABLE ALEATORIA
  • Es un promedio pesado del valor de cada resultado
    posible multiplicado por la probabilidad de dicho
    resultado

118
DISTRIBUCIONES DE PROBABILIDADES
  • Están relacionadas con las distribuciones de
    frecuencias, generalmente se piensa como una
    distribución de frecuencia teórica cuando se
    habla de distribución de probabilidades.
  • TIPOS
  • DISCRETAS Cuando los datos y la variable toma
    números limitados de valores.
  • CONTINUAS Cuando los datos y la variable (toma
    valores en un rango a utilizar) y la población se
    puede decir que es muy grande (infinita)
  • DISTRIBUCIONES DISCRETAS
  • Entre las funciones de distribución de
    probabilidades que más utilizamos están
  • HIPERGEOMETICA
  • BINOMIAL
  • POISSON

119
LA DISTRIBUCION BINOMIAL
HIPERGEOMETICA
  • Se utiliza cuando la muestra de la población es
    finita y se toma la muestra sin reemplazo
  • Para fines de la carrera es muy poco utilizado.
  • Se utiliza en probabilidad discreta, cuyo número
    de elementos es infinito, es usada cuando tenemos
    atributos, ejemplo aceptable, no aceptable,
    éxito o fracaso, falla o no falla, etc.
  • Esta describe resultados de un proceso de
    Bernoulli (este proceso dice que las
    probabilidades solo pueden ser p éxito, cara,
    etc
  • q1-p, lo contrario de p. La probabilidad de
    este evento permanece fijo respecto al tiempo.
  • Los eventos son estadísticamente independientes.

120
Formula de la Binomial
  • P(Probabilidad de r éxitos en n ensayos)
  • p probabilidad de tener éxito
  • q probabilidad de no tener éxito
  • r de éxitos deseados
  • n de intentos hechos.

121
DISTRIBUCION DE POISSON
  • Se utiliza en probabilidad discreta, se aplica a
    diversas situaciones que aplican la realización
    de observaciones por unidad de tiempo. Ejemplo
    contar el número de vehículos que llegan a una
    caseta de control, contar el número de máquinas
    descompuestas durante 1 día, distribución de
    llamadas telefónicas que llegan a un conmutador,
    la demanda de pacientes que necesitan servicios,
    etc.

CARACTERISTICAS
  • Con el ejemplo del número de vehículos que pasan
    por una sola caja de una caseta de cobro, daremos
    las características
  • La media del número de vehículos que llegan por
    hora pico puede estimarse a partir de datos sobre
    tráfico que se tengan disponibles.
  • Si dividimos la hora pico en períodos
    (intervalos) de un segundo cada uno,
    encontraremos las siguientes afirmaciones
  • A) La probabilidad de que exactamente un vehículo
    llegue a una caja por segundo es muy pequeño.

122
FORMULA
  • B) La probabilidad de que dos o más vehículos
    lleguen en un intervalo de un segundo es muy
    pequeña.
  • C) El número de vehículos que llegan a un
    intervalo dado de un segundo es independiente de
    que dicho intervalo se presente en la hora pico.
  • El número de llegadas en cualquier intervalo de
    un segundo no depende del número de llegadas en
    cualquier otro intervalo de un segundo.

Donde Número medio de presentaciones por
intervalos de tiempo. X Valor de variable.
123
FUNCIONES CONTINUAS
  • La más utilizada es la Normal y es sobre la cual
    esta soportada muchas aplicaciones.
  • Definimos
  • Donde
  • xi Dato
  • Media

124
ANALISIS DE REGRESION Y CORRELACION
  • ANALISIS DE REGRESION
  • El término regresión, se uso por primera vez
    como un concepto estadístico por Sir Francis
    Galton. Galton hizo un estudio que mostró que,
    la altura de los niños de los padres altos tiende
    a bajarse, o "regresar", hacia la altura media de
    la población. El designó la palabra "regresión"
    como el nombre del proceso general de predecir
    una variable (la altura de los niños), a partir
    de otra (la altura de los padres).
  • Posteriormente, los estadísticos usaron el
    término regresión múltiple para describir el
    proceso mediante el cual se usan varias variables
    para predecir otra.
  • En el análisis de regresión, se desarrollará una
    ecuación de estimación, es decir, una fórmula
    matemática que relaciona las variables conocidas
    con la variable desconocida

125
  • TIPOS DE RELACIONES DE CURVAS DE REGRESION
  • Los análisis de regresión y correlación, están
    basados en la relación o asociación entre dos o
    más variables. La variable conocida es llamada
    variable independiente. La variable que se está
    tratando de predecir es la variable dependiente.
  • REGRESION LINEAL
  • La ecuación de la relación lineal es
  • Y ao a1X
  • Donde ao a1 son parámetros estadísticos que se
    deben calcular.

126
  • METODO DE MINIMOS CUADRADOS
  • Consideremos los puntos representados por
    (X1,Y1), (X2,Y2), ..., (Xn,Yn). Para un valor de
    Xi, existirá una diferencia Di entre Yi y el
    valor que da la ecuación de ajuste. Cada
    diferencia Di, se conoce como desviación, error o
    residuo la cual, puede ser positiva, negativa o
    cero.
  • De todas las curvas de aproximación a una serie
    de datos puntuales, la curva que tiene la
    propiedad de que
  • D12 D22 ... DN2 es mínimo
  • se conoce como la mejor curva de ajuste. Así una
    recta con esta propiedad se llama recta de
    mínimos cuadrados y tiene la ecuación
  • Y ao a1X
  • donde las constantes ao y a1 se determinan
    mediante el sistema de ecuaciones simultáneas
  • S Y ao (N) a1 (S X)
  • S XY ao (S X) a1 (S X2)
  • que son llamadas ecuaciones normales para la
    recta de mínimos cuadrados.
  • Si se resuelve el sistema en forma general,
    entonces se obtienen las siguientes fórmulas

127
Formulas para calcular los valores
128
  • CORRELACION
  • La correlación, es el grado de relación que
    existe entre las variables, y un análisis de
    correlación determina en que medida una ecuación
    lineal o de otro tipo describe o explica de una
    forma adecuada la relación entre las dos
    variables.
  • Si todos los valores de las variables satisfacen
    exactamente una ecuación, se dice que las
    variables están correlacionadas perfectamente o
    que hay correlación perfecta entre ellas. Así
    las áreas "A" y los radios "r" de todos los
    círculos están correlacionados perfectamente,
    puesto que A p r2. Las variables altura y
    peso de los individuos muestran cierta
    correlación.
  • CORRELACION LINEAL
  • Consideremos el diagrama de dispersión de la
    figura 4.3, si "Y" tiende a incrementarse cuando
    "X" aumenta, como en (a), la correlación se dice
    positiva o correlación directa. Si "Y" tiende a
    disminuir cuando se incrementa "X", como en (b),
    la correlación se dice negativa o correlación
    inversa. Si no hay ninguna relación entre las
    variables, como en (c), se dice que no hay
    correlación entre ellas, es decir, no están
    correlacionadas.

129
  • COEFICIENTE DE CORRELACION LINEAL
  • Si se supone una relación lineal entre las dos
    variables, el coeficiente de correlación se
    calcula como
  • Donde r esta en el rango entre -1 y 1, si
  • r1 se dice que es una buena correlación y si
    r0, no hay correlación

130
COEFICIENTE DE DETERMINACION Al cuadrado del
coeficiente de correlacion se le denomina
coeficiente de determinacion. Aunque el mas
utilizado es el coeficiente de correlacion, es el
coeficiente de determinacion el que tiene un
significado mas concreto. El coeficiente de
determinacion representa la fraccion (o el
porcentaje) de la variacion de y que es
explicada por la variacion de x. Por ejemplo,
si obtenemos un coeficiente de correlacion de
0.95 y lo elevamos al cuadrado obtenemos 0.9025,
es decir que la variacion de la variable
independiente (x) explica el 90.25 de la
variacion de la variable dependiente (y). El
otro 10 de la variacion de y es atribuible a
otras causas que pueden incidir en dicha variable.
131
  • EJEMPLO
  • Los siguientes datos son las mediciones de
    velocidad del aire y del coeficiente de
    evaporación de las gotitas de combustible en una
    turbina de propulsión.
  • Velocidad del aire Coeficiente de
    evaporación
  • X (cm/seg) Y
    (mm2/seg)

  • 20
    0.18
  • 60
    0.37
  • 100
    0.35
  • 140
    0.78
  • 180
    0.56
  • 220
    0.75
  • 260
    1.18
  • 300
    1.36
  • 340
    1.17
  • 380
    1.65
  • Encuentre
  • a) la ecuación de la recta de mínimos cuadrados,
  • b) utilice la ecuación anterior, para estimar el
    coeficiente de evaporación de una gotita
    cuando la velocidad del aire es de 190 cm/seg,
  • c) coeficiente de correlación.

132
  • SOLUCION
  • a) Recta de regresión "Y" sobre "X"
  • X Y X2
    Y2 XY

  • 20 0.18 400 0.0324
    3.6
  • 60 0.37 3,600 0.1369
    22.2
  • 100 0.35 10,000 0.1225
    35.0
  • 140 0.78 19,600 0.6084
    109.2
  • 180 0.56 32,400 0.3136
    100.8
  • 220 0.75 48,400 0.5625
    165.0
  • 260 1.18 67,600 1.3924
    306.8
  • 300 1.36 90,000 1.8496
    408.0
  • 340 1.17 115,600 1.3689
    397.8
  • 380 1.65 144,400 2.7225
    627.0

  • 2,000 8.35 532,000 9.1097
    2,175.4

133
  • N 10 datos
  • S X 2,000 S X2 532,000
  • S Y 8.35 S XY 2,175.40
  • Sustituyendo en las ecuaciones normales
  • S Y ao N a1 S X
  • S XY ao S X a1 S X2
  • 8.35 ao 10 a1 2,000 (1)
  • 2,175.40 ao 2,000 a1 532,000 (2)
  • Resolviendo las ecuaciones (1) y (2) en forma
    simultánea tenemos
  • ao 0.069 a1 0.0038,
  • sustituyendo en Y ao a1 X, obtenemos la
    ecuación de la recta de regresión de "Y" sobre
    "X"
  • Y 0.069 0.0038 X (3)
  • b) para X 190 el coeficiente de evaporación
    será
  • Y 0.069 0.0038(190) 0.79
  • Y 0.79 mm2/seg

134
  • c) el coeficiente de correlación es
  • r 10(2,175.40) - (2,000)(8.35)
    0.95
  • Ö 10(532,000)-(2,000)210(9.1097) -
    (8.35)2
  • El valor del coeficiente de correlación nos
    indica
  • que la correlación es positiva, debido al signo
    del coeficiente,
  • que la relación entre X Y es bastante buena,
    ya que el coeficiente es bastante cercano a 1,
    en valor absoluto,
  • cuando el coeficiente es bastante cercano a
    cero, se dice que no hay correlación entre las
    variables X Y.

135
  • d) el coeficiente de determinacion es
  • r2 0.95 2 0.9025 equivalente a 90.25
  • El valor del coeficiente de determinacion nos
    indica
  • Que podemos atribuir en un 90.25 la variacion
    de Y a la variacion de X y un 9.75 de la
    variacion es atribuible a otros factores que no
    fueron considerados en el modelo matematico.
  • Cuando el porcentaje es bajo, digamos abajo del
    80, debemos escoger otra variable independiente
    o agregar una variable mas al modelo y realizar
    un analisis de regresion multiple.

136
CURVE EXPERT
  • Es uno de tantos programas disponibles para
    realizar analisis de regresion y correlacion.
    Tiene la ventaja de tener predetermina-dos una
    gran cantidad de modelos, aparte de los que el
    usuario quiera definir. Es un Shareware que se
    encuentra disponible en internet.
Write a Comment
User Comments (0)
About PowerShow.com