Revisi - PowerPoint PPT Presentation

1 / 132
About This Presentation
Title:

Revisi

Description:

Title: Revisi n de los Conceptos B sicos de Probabilidad Author: Daniel Finol Last modified by: Daniel Created Date: 6/19/2003 3:54:10 PM Document presentation format – PowerPoint PPT presentation

Number of Views:264
Avg rating:3.0/5.0
Slides: 133
Provided by: DanielF171
Category:

less

Transcript and Presenter's Notes

Title: Revisi


1
Inferencia Estimación Puntual y por Intervalos
Tema 2
2
  • I keep saying the sexy job in the next ten years
    will be statisticians. People think I'm joking,
    but who would've guessed that computer engineers
    would've been the sexy job of the 1990s?
  • Hal Varian
  • Economista en Jefe de Google
  • Enero 2009

3
Contenido programático
  • Muestreo y Estimación puntual
  • La media muestral
  • Ley de los Grandes Números
  • Teorema central del Límite
  • Estimación por Intervalos de confianza
  • Distribuciones asociadas a la Normal en el
    muestreo

4
Qué es Inferencia?
  • Objetivo usar datos muestrales
  • para extraer información de la
  • población
  • Estimar parámetros
  • Construir intervalos de confianza
  • Realizar pruebas acerca de los valores de los
    parámetros
  • Determinar el tipo de distribución que
    caracteriza a la población

5
MUESTREO ALEATORIO SIMPLE
Representativa de la población
Seleccionar observaciones más convenientes
6
MUESTREO ALEATORIO SIMPLE
  • Dada una Variable aleatoria X, un conjunto X1,
    X2, ...,Xn de variables es una Muestra Aleatoria
    Simple (MAS) de X si
  • Cada Xi tiene la misma distribución que X.
  • Las variables X1, X2, ...,Xn son estadísticamente
    independientes entre sí.

7
MUESTREO ALEATORIO SIMPLE
  • No confundir el concepto de muestra como
  • Resultado de observar el valor que toman las n
    variables X1, X2, ...,Xn en un proceso de
    muestreo.

8
Muestra
  • Las propiedades estadísticas que aquí se estudian
    se refieren a la MAS como variable aleatoria
    multivariada y no como al conjunto de números
    resultantes de la observación de la misma.

9
Las variables X1Xn constituyen una muestra
aleatoria de tamaño n de una distribución cuya
media es µ y cuya varianza es s2. En otras
palabras, cada Xi tiene media µ y varianza s2.
10
Estadísticos
  • Un estadístico es una función de la muestra X1,
    X2, ...,Xn.
  • Constituye una nueva variable aleatoria
    construida a partir de la muestra aleatoria
    simple.
  • Es más sencillo operar con él que con la muestra
    como tal.
  • Ejemplos
  • Media muestral Máx máximo X1, X2,
    ...,Xn
  • Mín mínimo X1, X2, ...,Xn Rango máx
    - mín.
  • Varianza muestral

11
Muestreo Estadístico
  • Propósito
  • Hacer inferencias acerca de la población.
    Específicamente
  • estimar los parámetros (?1, ?2, ...)
    desconocidos de la variable aleatoria X que
    representa a la población.
  • Ej. Si la vida de un Venezolano se caracteriza
    con una distribución exponencial X(?),
  • Hallar ? que es su esperanza de vida.

12
Cómo se estima?
  • Mediante estadísticos adecuados, útiles, cuyas
    distribuciones se conocen, como la media
    muestral, la varianza muestral, el máximo de la
    muestra, etc..
  • Supuestos
  • El tipo de distribución es conocida
  • Los parámetros son desconocidos

13
Estimadores
  • T es un estimador de ? si es un estadístico que
    permite estimar un parámetro ?
  • Estimación puntual de ? resultado de T calculado
    sobre los valores específicos de la muestra

14
Estimadores
Proceso de Muestreo
15
Propiedades de los estimadores puntuales
16
La estimación puntual es similar al proceso de
disparar con una pistola a un blanco o lanzar un
dardo a una diana
17
  • El estimador es semejante a la pistola
  • una estimación en particular, a la bala
  • y el parámetro de interés al centro del blanco.
  • Sacar una muestra de la población y estimar el
    valor del parámetro es equivalente a disparar un
    solo tiro al blanco.

18
  • Suponga que una persona dispara un solo tiro al
    blanco y que el tiro da en el centro.
  • Concluimos que es un excelente tirador?
  • Querría usted sostener el blanco mientras se
    dispara el segundo tiro?
  • Evidentemente, no decidiríamos que el hombre es
    un tirador experto basados en tan escasa
    evidencia.

19
Sin embargo, si un millón de tiros sucesivos dan
en el centro del blanco, podríamos tener
suficiente confianza en el tirador para sostener
el blanco en el siguiente tiro. El hecho que se
desea enfatizar es No podemos evaluar la
bondad de un procedimiento de estimación puntual
basándonos en una sola estimación, más bien
debemos observar los resultados y utilizar el
procedimiento de estimación muchas, muchas veces.
20
Precisión y Exactitud
Características deseables de un buen estimador
  • Precisión que las estimaciones no se dispersen
    demasiado
  • Exactitud que si se realizan numerosos
    experimentos el promedio del estadístico sea el
    parámetro a estimar.

21
Precisión y Exactitud
Varianza
Precisión
Valor esperado
Exactitud
22
  • T es un estimador insesgado de ? si E(T) ?.
  • Supongamos que se tiene un número indefinido de
    muestras de una población, todas ellas del mismo
    tamaño n.
  • Sobre cada muestra el estimador nos ofrece una
    estimación concreta del parámetro que buscamos.
  • Pues bien, el estimador es insesgado, si sobre
    dicha cantidad indefinida de estimaciones, el
    valor medio obtenido en las estimaciones es ?.

23
Error Cuadrático Medio(Mean Square Error)
  • Si T es un estimador de ?, el MSE es una medida
    de dispersión de T respecto de ?.
  • MSE E(T - ?)2
  • Propiedad
  • MSE VAR(T) (E( T) - ?)2

24
Error Cuadrático Medio(Mean Square Error)
. . . .
. . .
. . .
.
. . . .
. . . .
.
?
25
Error Cuadrático Medio(Mean Square Error)
  • Insesgado
  • T es un estimador insesgado de ? si E(T) ?
  • Se entiende por sesgo del estimador a la
    diferencia E(T) ?
  • MSE Var(T) (sesgo)2
  • Objetivo minimizar ambos términos varianza y
    sesgo

26
Insesgados de Varianza Mínima
  • T es un estimador insesgado de varianza mínima de
    ? si es el de menor varianza entre todos los
    estimador insesgados.

Insesgado E (T1) E ( T2) ? V (T1) gt V ( T2)
T2
Deseado
27
Ejemplo
Sea X1, X2,, X7 una muestra aleatoria de una
población que tiene media µ y varianza s2.
Considere los siguientes estimadores de µ
  1. Alguno de estos estimadores es insesgado?
  2. Cuál estimador es el mejor?

28
Ejemplo
La lectura de un voltímetro conectado a un
circuito de prueba tiene una distribución
uniforme en el intervalo (?, ?1) en donde ? es
el verdadero pero desconocido voltaje del
circuito. Suponga que Y1, Y2,, Yn es una
muestra aleatoria de tales lecturas.
Demuestre que es un estimador sesgado de ? y
calcule su sesgo.
29
Teorema de Chebychev(Tchebisheff, Tchebichev)
Sea X una variable aleatoria. Entonces, para
cualquier kgt0
La desigualdad de Chebychev provee una cota que
no depende de la distribución, sino de la
varianza de X
30
PORCENTAJE DE LA DISTRIBUCIÓN MAYOR QUE K
DESVIACIONES ESTÁNDAR A PARTIR DE LA MEDIA
k Regla de Chebychev Distribución normal
1.5 Menor que 44.4 13.4
2 Menor que 25.0 4.6
3 Menor que 11 0.27
4 Menor que 6.3 0.01
La cota que ofrece la desigualdad de Chebychev
puede ser grosera en algunos casos, pero debemos
recordar que la desigualdad sirve para todas las
distribuciones.
31
Teorema de Chebychev(Tchebisheff, Tchebichev)
También puede escribirse
µ-e µ µe
32
Ejemplo
Si E(X)5 y V(X)100/12. (e4) P(X 5 gt
4) lt ? Si ahora suponemos XU(0,10), cuánto es
la probabilidad?
33
Consistencia
  • Concentración del estimador en torno a ? a medida
    que la muestra crece (cuando la información
    aumenta).
  • Es esta propiedad de consistencia de un estimador
    lo que permite conformarse con el valor observado
    de un estimador y asumirlo como representativo
    del verdadero valor del parámetro ?.

T5
N 5
N 100
34
Consistencia
  • Tn es un estimador consistente de ? si
  • Para todos los valores de ? y donde e es un
    número positivo arbitrario.

35
(No Transcript)
36
Media Muestral
  • Sea X de valor esperado µ y desviación estándar
    s
  • y X1, X2, ...,Xn muestra aleatoria simple de X.
  • Por las propiedades ya establecidas sobre la suma
    de variables aleatorias independientes
  • E(m) µ
  • V(m)s2/n
  • Luego, m es un estimador insesgado de µ.

37
Media Muestral
De aquí, la media de la media muestral (m) es
igual a la media de la distribución de la cual se
seleccionó la muestra aleatoria, pero la varianza
de m es solo 1/n veces la varianza de esa
distribución.
La distribución de probabilidad de la media
muestral estará más concentrada alrededor del
valor medio µ que la distribución original.
38
Concentración de la Media Muestral
  • La media muestral tiene el mismo valor
    esperado pero está más concentrada en torno a µ,
    ya que la desviación estándar disminuye con la
    raíz cuadrada de n.

39
Varianza Muestral
La varianza muestral
Es un estimador insesgado de s2
40
Varianza Muestral
Luego, E(S2) s2
41
Varianza Muestral
Observe el denominador
  • Es un estimador insesgado de la varianza de la
    población, E(S2) V(X)
  • Es consistente
  • No existe un teorema de convergencia como el
    teorema central del límite

42
Importancia de la Media Muestral
  • Su relevancia en la estadística se resume en
    dos grandes propiedades
  • Ley de los Grandes Números
  • Teorema Central del Límite

43
Ley de los Grandes Números
  • La media muestral es un estimador
    consistente de µ
  • La consistencia es el fundamento teórico para la
    estimación de la media poblacional por la media
    muestral.

44
(No Transcript)
45
(No Transcript)
46
(No Transcript)
47
Ley de los Grandes Números
  • La Ley de los Grandes Números indica que m se
    concentra entorno a µ, pero no indica cómo es la
    distribución de la media muestral. El siguiente
    teorema tiene ese propósito

48
Teorema Central del Límite
  • Cuando n ? 8 la distribución de la media
    muestral (m) se aproxima a la distribución de una
    Normal más precisamente el estadístico de la
    media estandarizada

Normal Estándar
49
Teorema Central del Límite
  • Cuando el tamaño de la muestra crece la
    distribución de la muestra se asemeja a la
    normal.

50
Uso del Teorema Central del Límite
  • Cualquiera sea la variable aleatoria X, su media
    muestral puede considerarse Normal si el tamaño
    muestral (N) es suficientemente grande.
  • Cuán grande debe ser la muestra?
  • X parecida a una Normal ? N 12
  • X asimétrica ? N 30
  • X muy asimétrica o multimodal ? N 50

51
Teorema Central del Límite
52
  • No todos los estadísticos son asintóticamente
    normales, por más grande que sea el N
  • Cuan grande es el N para que se observe la
    tendencia de la media muestral a la distribución
    normal, depende de la distribución de la
    población.

53
Distribución Uniforme
54
Distribución Uniforme
55
Distribución Exponencial
N15
N30
N50
56
Teorema Central del Límite
Suponga que en una población grande de seres
humanos, el diámetro craneal sigue una
distribución aproximadamente normal, con una
media de 185.6 mm y una desviación estándar de 12
mm. Cuál es la probabilidad de que una muestra
aleatoria de tamaño 16 de esta población tenga
una media mayor que 190?
57
Teorema Central del Límite
Los resultados de las pruebas de aptitud
académica de todos los alumnos de los liceos de
Maracaibo tiene una media de 60 y una varianza de
64. El valor de la media de una generación
específica de cierto liceo de Mérida con n100
alumnos fue 58 Puede afirmarse que este liceo
tiene peores resultados que los de Maracaibo?
58
Teorema Central del Límite
Alumnos de Liceos de Maracaibo
Alumnos de Liceos de Mérida
59
Teorema Central del Límite
El Centro de apoyo de Ingeniería y Vivienda del
Ejército de Estados Unidos patrocinó en fechas
recientes un estudio de las características de
confiabilidad, disponibilidad y mantenimiento de
sistemas pequeños que trabajan con diesel y gas
en instalaciones militares y comerciales. El
estudio reveló que el tiempo, x, antes de que sea
necesario dar mantenimiento correctivo a sistemas
diesel auxiliares continuos tiene una
distribución exponencial aproximada con una media
estimada de 1700 horas. Suponiendo µ1700
calcule la probabilidad de que el tiempo medio
antes de dar mantenimiento correctivo a una
muestra de 70 sistemas diesel auxiliares
continuos exceda las 2500 horas.
60
Distribución de muestreo de una suma de variables
aleatorias
Si se extrae una muestra aleatoria de n
observaciones, y1, y2, , yn, de una población
con una media finita µ y una varianza s2,
entonces, si n es lo bastante grande, la
distribución de muestreo de la suma
Se puede aproximar con una función de densidad
normal con parámetros
µSnµ y s2S ns2
El estadístico sería
61
Distribución de muestreo de una suma de variables
aleatorias
El gerente de Mercadeo de pinturas Montana afirma
que con un galón de pintura se pinta una media de
20 metros, con una varianza de 2. Supongamos que
se desea pintar un área que tiene 630 metros.
Serán suficientes 32 galones? Qué probabilidad
tengo de que no me alcance?
62
Distribución de muestreo de una suma de variables
aleatorias
El sueldo mensual promedio de los habitantes de
Venezuela se distribuye uniformemente entre BsF.
500 y BsF. 3.500. Calcule la probabilidad de que
al seleccionar al azar a 100 personas, la suma de
sus sueldos supere los 220 mil bolívares.
63
Estimación por Intervalos
  • Un estimador proporciona un valor aproximado de
    un parámetro ? . Es suficiente?
  • Cuán próxima es la estimación al parámetro?
  • La estimación por intervalos de confianza es
    la respuesta.

La estatura media de los estudiantes de
ingeniería es aproximadamente 170 cm.
Estimación puntual
med170 cm
La estatura media de los estudiantes de
ingeniería se encuentra entre 169 y 172 cm
Estimación por intervalos
169 lt µlt172 cm
64
Definición
  • Si X1, X2, ...,Xn es una MAS de una Variable
    X, y se desea estimar ?, un intervalo de
    confianza (1-a) es un intervalo inf, sup, que
    tiene una probabilidad (1-a) de cubrir al
    parámetro ?.
  • Inf y sup son dos estadísticos de la muestra que
    cumplen
  • Prob (inf ? sup) 1 - a

65
Interpretación frecuentista
  • Si se toman 100 muestras aleatorias de la
    población, y se construye un intervalo de
    confianza inf, sup del 95 para cada una de
    ellas, se espera que en 95 de ellas el intervalo
    contenga al parámetro.

66
Interpretación frecuentista
5 rojos 2 blancos
6 rojos 1 blanco
67
Generación de intervalos de confianza
  • http//davidmlane.com/hyperstat/confidence_interva
    ls.html

68
Consideraciones Adicionales
  • Lo aleatorio es el intervalo inf, sup
  • ? es desconocido pero fijo
  • El método de construcción es el que posee el
    nivel de confianza
  • Observada la muestra y construido el intervalo
    concreto éste contendrá o no al parámetro.

69
Consideraciones Adicionales
  • No se sabe si el intervalo obtenido con una
    muestra en particular contiene o no el verdadero
    valor del parámetro,
  • pero el método utilizado para obtener el
    intervalo hace que éste contenga el valor
    verdadero el (1 - a) de las veces.

70
Intervalos de Confianza de Poblaciones Normales
  • De la media con s conocida
  • De la media con s desconocida
  • De la varianza

71
P(Z gt za) a
Cómo se construye un Intervalo de Confianza?
  • Si X es N(µ, s2) y tenemos una muestra de tamaño
    N, su media muestral m se distribuye también
    Normal pero N(µ, s2/N).

Distribución de la estadística
a/2
a/2
-za/2
za/2
72
P(Z gt za) a
Despejando la media teórica, nos queda
Esta expresión hace referencia a que, con una
probabilidad de 1-a, el intervalo aleatorio
contendrá el valor de µ.
73
Intervalo de confianza para la media, varianza
conocida
Se sabe que la duración, en horas, de un bombillo
de 75 watts tiene una distribución
aproximadamente normal, con una desviación
estándar de 20 horas. Se toma una muestra
aleatoria de 25 bombillos, la cual resulta tener
una duración promedio de 1014 horas. Construya un
intervalo de confianza bilateral del 95 para la
duración promedio de los bombillos.
74
Intervalo de confianza para la media, varianza
conocida
Qué observa al construir un intervalo de
confianza bilateral del 99 para la duración
promedio de los bombillos.
75
Intervalo de confianza para la media, varianza
conocida
Un equipo de investigadores está interesado en la
puntualidad de los pacientes en las citas
concertadas. En un estudio de flujo de pacientes
en los consultorios de médicos generales se
encontró que una muestra de 35 pacientes llegaba
17,2 minutos tarde a las citas, en promedio. Una
investigación previa había demostrado que la
desviación era de 8 minutos aproximadamente. Se
tuvo la sensación de que la distribución de la
población era normal. Cuál es el intervalo de
confianza de 90 para µ, que es el promedio real
de impuntualidad en las citas?
76
Intervalo de confianza para la media, varianza
conocida
  • Un fabricante produce anillos para los pistones
    de un motor de automóvil. Se sabe que el diámetro
    del anillo está distribuido aproximadamente de
    manera normal, y que tiene una desviación
    estándar s 0,001 mm. Una muestra aleatoria de
    15 anillos tiene un diámetro promedio de m
    74,036 mm.
  • Construya el intervalo de confianza bilateral del
    99 para el diámetro promedio del anillo.

77
Intervalo de Confianza de la Media µ con s
desconocida
  • Si se desconoce s, se debe recurrir a la
    distribución t de Student
  • Sea X ? N(µ, s2), X1,.....,Xn una M.A.S., m y
    s, media y desviación estándar muestral entonces
    el estadístico

es una t con n-1 grados de libertad
78
Dada la distribución del estadístico y el nivel
de confianza, se tiene la siguiente igualdad
79
  • Su aplicación inmediata es que

Es un intervalo de confianza de probabilidad
(1-a) del valor esperado, µ.
80
Intervalo de confianza para la media, varianza
desconocida
La dirección médica de una clínica desea estimar
el número promedio de días necesarios para el
tratamiento de pacientes con edades entre 25 y 34
años. Una muestra aleatoria de 500 pacientes de
la clínica con esas edades proporcionó una media
de 5.4 días y una desviación estándar de 3.1
días. Obtenga un intervalo de confianza de 95
para el promedio del tiempo de estancia de la
población de pacientes de la cual se obtuvo la
muestra.
81
Intervalo de confianza para la media, varianza
desconocida
Un ingeniero de control de calidad midió el
espesor de la pared de 25 botellas de vidrio de
dos litros. La media muestral es m4.05 mm,
mientras que la desviación estándar muestral es
s0.08 mm. Encuentre un intervalo de confianza
del 90 para la media del espesor de la pared de
las botellas.
82
La población tiene una distribución normal?
No

No

La muestra es grande?
No

La muestra es grande?
NP
Se conoce la varianza de la población?
No

Se conoce la varianza de la población?
Se conoce la varianza de la población?

No
No

z
t
t ó z
z
z
t ó z
Se aplica el teorema central del límite
NP Método no paramétrico
83
Intervalo de confianza para diferencia de medias,
para observaciones no apareadas
Diferencia entre dos poblaciones
Se toman dos muestras aleatorias independientes
de dos poblaciones de interés. Es decir, la
selección de elementos para una muestra no
afecta, ni es afectada por, la selección de
elementos para la otra muestra. Ej Estudiar la
presión sanguínea en mujeres que toman o no
cierta hormona. Tomamos un grupo de mujeres que
la toman y un grupo de mujeres que no la toman.
84
Intervalo de confianza para la diferencia de dos
medias, varianzas conocidas
Desviación de la diferencia muestral
85
Intervalo de confianza para la diferencia de dos
medias, varianzas conocidas
Se prueban dos fórmulas diferentes de un
combustible oxigenado para motor en cuanto al
octanaje. La varianza del octanaje para la
fórmula 1 es s211.5 mientras que para la fórmula
2 es s221.2. Se prueban dos muestras aleatorias
de tamaño n115 y n220. Los octanajes promedios
observados son m189.6 y m292.5. Construya un
intervalo de confianza bilateral del 95 para la
diferencia en el octanaje promedio.
86
Intervalo de confianza para la diferencia de dos
medias, varianzas conocidas
Se administra dos somníferos A y B a dos grupos
de pacientes en un hospital. El A especifica que
su desviación estándar es 1 hora, mientras el B
especifica 1.5 horas. Si los tamaños muestrales
son n115 y n2 20 para los grupos A y B y las
medias de sueño en esa noche fueron 10 y 9 horas
respectivamente, construya un intervalo de
confianza bilateral del 95 para la diferencia de
horas de sueño entre los somníferos
87
Intervalo de confianza para la diferencia de dos
medias, varianzas conocidas
Cuál somnífero concluye usted que es mejor?
De acuerdo al intervalo de confianza, podemos
concluir que el somnífero A produce más sueño que
el B. Es más, se tiene una confianza del 95 que
el somnífero A produce entre 0.17 y 1.83 horas
más de sueño que el somnífero B.
88
Intervalo de confianza para la diferencia de dos
medias, varianzas conocidas
Cuál somnífero hubiese concluido usted que
produce mejores resultados si el intervalo de
confianza le hubiese quedado, por ejemplo?
89
Intervalo de confianza para la diferencia de dos
medias, varianzas desconocidas
  • Se quiere estimar un intervalo de confianza del
    95 para la diferencia entre los salarios
    iniciales medios de los graduados recientes en
    ingeniería mecánica e ingeniería civil de la
    Universidad de Florida (UF). Se cuenta con la
    siguiente información
  • Una muestra aleatoria de 59 salarios iniciales
    de graduados en ingeniería mecánica de la UF
    arrojó una media muestral de 32675 y una
    desviación estándar de 4430
  • Una muestra aleatoria de 30 salarios iniciales
    de
  • graduados en ingeniería civil de la UF arrojó una
  • media muestral de 27460 y una desviación
  • estándar de 4286

90
Intervalo de confianza para diferencia de medias,
para observaciones no apareadas
Diferencia entre dos poblaciones
Se toman dos muestras aleatorias independientes
de dos poblaciones de interés. Es decir, la
selección de elementos para una muestra no
afecta, ni es afectada por, la selección de
elementos para la otra muestra. Ej Estudiar la
presión sanguínea en dos grupos de mujeres que
toman cierta hormona. Tomamos un grupo de mujeres
que la toman y un grupo de mujeres que no la
toman.
91
Intervalo de confianza para diferencia de medias,
para observaciones apareadas
Muestras apareadas
Existen solo n unidades experimentales diferentes
y los datos están recopilados por pares gt cada
unidad experimental está formada por dos
observaciones Ej Estudiar la presión sanguínea
en un grupo de mujeres antes y después de tomar
cierta hormona. (En este ejemplo los datos son
los conjuntos de medidas en las mismas personas).
92
Intervalo de confianza para diferencia de medias,
para observaciones apareadas
Un científico de la computación está investigando
la utilidad de dos lenguajes de diseño para
mejorar las tareas de programación. Se pide a
doce programadores expertos, familiarizados con
los dos lenguajes, que codifiquen una función
estándar en ambos lenguajes, anotando el tiempo,
en minutos, que requieren para hacer esta tarea.
Los datos obtenidos son los siguientes
Programador Programador Programador Programador Programador Programador Programador Programador Programador Programador Programador Programador
Sitio 1 2 3 4 5 6 7 8 9 10 11 12
Lenguaje 1 17 16 21 14 18 24 16 14 21 23 13 18
Lenguaje 2 18 14 19 11 23 21 10 13 19 24 15 20
Diferencia -1 2 2 3 -5 3 6 1 2 -1 -2 -2
d 2/3
Encuentre un intervalo de confianza del 95 para
la diferencia en los tiempos de codificación
promedio. Existe algo que indique una
preferencia por alguno de los lenguajes?
93
Intervalo de confianza para diferencia de medias,
para observaciones apareadas
El Journal of Environmental Engineering informó
de un modelo de transferencia de calor diseñado
para predecir la pérdida de calor durante el
invierno en clarificadores utilizados para el
tratamiento de aguas de desecho. El análisis
implicó una comparación de la irradiación solar
con cielo despejado sobre superficies en dos
puntos con diferentes latitudes. Se registraron
los niveles de radiación solar durante siete
días. Establezca un intervalo de confianza de 95
para la diferencia media entre los niveles de
irradiación solar de día completo con cielo
despejado en los dos sitios. Interprete los
resultados.
Sitio dia1 dia2 dia3 dia4 dia5 dia6 dia7
St Joseph 782 965 948 1181 1414 1633 1852
Grandes Lagos 593 672 750 988 1226 1462 1698
94
Intervalo de Confianza de la Media µ cuando se
conoce s
  • Precisión

La estatura media está entre 171 y 173 cm con una
confianza del 95

Precisión
La estatura media está entre 165 y 175 cm con
una confianza del 99
-
95
Intervalo de Confianza de la Media µ cuando se
conoce s
  • Se puede dar un intervalo con una confianza del
    100

Z0,0 8
(-8 , 8)
El peso promedio de los estudiantes de
ingeniería se encuentra entre -8 y 8. Esto es
cierto, pero inútil
96
De qué tamaño debo tomar la muestra?
  • Cuando se realiza un muestreo ingenuamente se
    quiere que la estimación sea
  • Exacta o al menos muy precisa
  • Verdadera o al menos muy confiable
  • Barata

97
Confiable preciso y barato?
  • Cuando se estima µ y s es conocido, el intervalo
    de confianza tiene una longitud de
  • estableciéndose una relación simple entre
  • La confianza (1-a )
  • La precisión L
  • El tamaño muestral N

98
Intervalo de Confianza de la Media µ cuando se
conoce s
  • Longitud
  • Mayor es la seguridad de que el intervalo
    contenga el verdadero valor del parámetro
  • Menor información se tiene acerca del valor
    verdadero
  • Menor es la precisión

Mientras más grande es la longitud del intervalo
99
Tamaño Muestral
  • Obsérvese que no se puede fijar arbitrariamente
    los 3 números!

1-a
L
Confianza
Precisión
Sólo se pueden fijar 2!
N
Tamaño Muestral
100
Tamaño Muestral
  • Si se fija precisión (L) y confianza (1-a)
    resulta
  • Para disminuir el intervalo a la mitad es
    necesario cuadriplicar la muestra.

101
Determinación del tamaño de la muestra para la
estimación de las medias
Definición
Si xbarra se utiliza como estimación de µ,
entonces puede tenerse una confianza del
100(1-a) de que el error no será mayor que una
cantidad específica E cuando el tamaño de la
muestra sea
102
µ
Longitud del intervalo
103
µ
Longitud del intervalo (L) 2E
104
Intervalo de Confianza de la Media µ cuando se
conoce s
  • Tamaño de la muestra

donde
105
  • Tamaño de la muestra
  • Considerando el resto de los parámetros fijos
  • Conforme disminuye la longitud del intervalo 2E,
    el tamaño requerido de la muestra aumenta.
  • A medida que aumenta s, el tamaño requerido de la
    muestra aumenta.
  • Conforme aumenta el nivel de confianza, el tamaño
    de la muestra aumenta.

106
Tamaño Muestral en función de L/sigma
107
Determinación del tamaño de la muestra para la
estimación de las medias
Un nutricionista, va a efectuar una encuesta
entre una población de muchachas adolescentes con
el fin de determinar su ingestión diaria promedio
de proteínas, por lo que desea saber qué tamaño
de la muestra debería tomar. Suponga que el
nutricionista quiere un intervalo con una
dimensión de aproximadamente 10 grs., un
intervalo de confianza de .95 y que, con base en
su experiencia previa, sabe que la desviación
estándar de la población es de alrededor de 20
grs.
108
Tamaño Muestral
  • Qué hacer si s es desconocido?
  • No es posible sustituirla por s ya que
    depende de m y N
  • Existe una estimación previa?
  • Opinión de expertos confiable?
  • Existe una estimación anterior de s con su
    intervalo de confianza adecuado?

109
Muestreo Preliminar
  • Si no se dispone de una estimación anterior de s,
    es necesario hacer un muestreo preliminar
  • Conservador Calcule un intervalo de confianza
    de s, (con confianza0,7 por ejemplo)
  • use su extremo superior como s si desea ser
    cauteloso aunque el N obtenido sea grande.
  • Pragmático Úsese directamente el s muestral
    estimado si confía en la estimación preliminar,
    corriendo el riesgo de que el N sea subestimado

110
Intervalo de confianza para la proporción de una
población
111
Intervalo de confianza para la proporción de una
población
Un grupo de investigadores encontró que en una
muestra de 591 pacientes en un hospital
psiquiátrico, 204 pacientes admitieron que
consumieron marihuana al menos una vez durante su
vida. Se pretende construir un intervalo de
confianza de 95 para la proporción de individuos
que consumieron marihuana durante su vida en la
población de internos del hospital.
112
Determinación del tamaño de la muestra para la
estimación de proporciones
113
Determinación del tamaño de la muestra para la
estimación de proporciones
Se planea realizar una encuesta para determinar
qué proporción de familias en cierta área carece
de servicio médicos. Se cree que la proporción no
puede ser mayor que 0.35. Se desea un intervalo
de confianza del 95 con E 0.05. Cuántas
familias deben encuestarse?
114
Intervalo de Confianza de la Varianza
  • Cuando se desea estimar la varianza teórica (s2)
    a partir de una muestra de tamaño n, se debe
    recurrir a la distribución (Ji-cuadrado) con
    n-1 grados de libertad
  • La distribución considera la varianza muestral
    S2

Es una con n-1 grados de libertad.
115
Intervalo de Confianza de la Varianza
  • De la ecuación anterior se deduce que

116
Intervalo de confianza para la varianza de una
población
117
Intervalo de confianza para la varianza de una
distribución normal
Si s2 es la varianza muestral de una muestra
aleatoria de tamaño n, tomada de una
distribución normal con varianza desconocida s2,
entonces, un intervalo de confianza del 100(1-a)
para s2 es
donde X2a/2,n-1 y X21-a/2,n-1 son los puntos
críticos superior e inferior respectivamente que
corresponden a la probabilidad a/2 de la
distribución ji-cuadrada con n-1 grados de
libertad
118
Intervalo de confianza para la varianza de una
población
Supuesto
La técnica de estimación se aplica a n tanto
grandes como pequeñas, siempre que se suponga que
la población de la cual se seleccionó la muestra
tiene aproximadamente, una distribución normal.
119
Intervalo de confianza para la varianza de una
población
Un supervisor de control de calidad en una
enlatadora sabe que la cantidad exacta contenida
en cada lata varía, pues hay ciertos factores
imposibles de controlar que afectan la cantidad
de llenado. El llenado medio por lata es
importante, pero igualmente importante es la
variación s2 de la cantidad de llenado. Si es
grande algunas latas contendrán muy poco y otras
demasiado. A fin de estimar la variación s2 del
llenado de la enlatadora, el supervisor escoge al
azar 10 latas y pesa el contenido de cada una,
obteniendo los siguientes pesos (en onzas) 7.96
7.90 7.98 8.01 7.97 7.96 8.03 8.02 8.04
8.02 Establezca un intervalo del 90 para la
variación del llenado de las latas
120
Intervalo de confianza para la varianza de una
distribución normal
  • Se utiliza el término jitter o perturbación
    oscilatoria (www.canare.com.hk/
    Tech20Notes/Jitter.htm) para describir las
    variaciones en el tiempo de conducción de un
    sistema de energía modular de agua pulsada. Es
    indispensable que el jitter de transferencia sea
    bajo para que una tecnología de línea de agua
    tenga éxito. Una investigación del jitter de
    transferencia en el interruptor de abertura de
    plasma de un sistema prototipo produjo para el
    tiempo de conducción en n18 pruebas, una media
    334.8 nanosegundos y s6.3 nanosegundos .
  • Establezca un intervalo de confianza de 95 para
    la verdadera desviación estándar de los tiempos
    de conducción del sistema prototipo.
  • Se considera que un sistema tiene jitter de
    transferencia bajo si la verdadera desviación
    estándar del tiempo de conducción es menor que 7
    nanosegundos El sistema prototipo satisface este
    requisito?

121
Intervalo de confianza para la varianza de una
distribución normal
Un fabricante de detergente líquido está
interesado en la uniformidad de la máquina
utilizada para llenar las botellas. De manera
específica, es deseable que la desviación
estándar s del proceso de llenado sea menor que
0.15 onzas de líquido de otro modo, existe un
porcentaje mayor del deseable de botellas con un
contenido menor de detergente. Supóngase que la
distribución del volumen de llenado es
aproximadamente normal. Al tomar una muestra
aleatoria de 20 botellas, se obtiene una
varianza muestral s2 0.0153 (onzas de
líquido)2. Con estos valores podría usted
afirmar que la desviación estándar del proceso
es la deseable? Considere un intervalo superior
de confianza del 95.
Cota de confianza inferior del (1-a)
Cota de confianza superior del (1-a)
122
Intervalo de confianza para el cociente de
varianzas de dos distribuciones normales
Comparar varianzas
Se hace inferencia acerca del cociente o razón
s12/s22
123
Distribución F
Grados de libertad del numerador
Grados de libertad del denominador
Cociente de dos variables Chi-cuadrada divididas
entre sus grados de libertad
Distribución F con Ny-1 y Nx-1 grados de libertad
124
Intervalo de confianza para el cociente de
varianzas de dos distribuciones normales
125
Intervalo de confianza para el cociente de
varianzas de dos distribuciones normales
Densidad de la Distribución F con r y s grados de
libertad
126
Intervalo de confianza para el cociente de
varianzas de dos distribuciones normales
Si s12 y s22 son las varianzas muestrales de dos
muestras aleatorias de tamaños n1 y n2,
respectivamente, tomadas de dos poblaciones
normales e independientes con varianzas s12 y s22
desconocidas, entonces, un intervalo de confianza
del 100(1-a) para el cociente s12/s22 es
donde fa/2,n2-1,n1-1 y f1-a/2,n2-1,n1-1 son los
puntos críticos superior e inferior que
corresponden al porcentaje a/2 de la distribución
F con n2-1 y n1-1 grados de libertad en el
numerador y denominador, respectivamente.
127
Intervalo de confianza para el cociente de
varianzas de dos distribuciones normales
128
Intervalo de confianza para el cociente de
varianzas de dos distribuciones normales
Una empresa ha estado experimentando con dos
disposiciones físicas distintas de su línea de
ensamble. A fin de obtener una disposición que
permita un mayor control del proceso, usted
sugiere que se adopte de manera permanente la
disposición que exhiba la varianza más pequeña en
el número de unidades terminadas producidas al
día. Dos muestras aleatorias independientes
producen los siguientes resultados n1 21
días n225 días s12 1.432 s223.761 Establezca
un intervalo de confianza del 95 para s12/s22 ,
la razón de las varianzas del número de unidades
terminadas para las dos disposiciones de línea de
ensamble. Con base en el resultado, cuál de las
dos disposiciones recomendaría usted?
129
Intervalo de confianza para el cociente de
varianzas de dos distribuciones normales
Si el intervalo hubiese sido Cuál
hubiese sido su conclusión?
130
Distribuciones en el muestreo asociadas a la
Normal
131
Distribución T de Student
  • Características
  • Nexo entre las medias muestral y teórica en una
    población normal.
  • Simétrica, como una normal aplastada
  • Cuando los grados de libertad (gl) crecen, la
    distribución t tiende a una Normal Estándar.
  • Si gl gt 30 no se distingue de una normal estándar

132
Distribución T de Student
  • Parámetros
  • gl (Grados de libertad)
  • Variable aleatoria
  • T
  • Valor esperado
  • E(X) 0
  • Varianza
  • V(X) gl/(gl-2) para gl gt 2
  • Función de distribución acumulada en el SAS
  • PROBT(t,gl)
  • Inversa
  • TINV(p, gl).

133
Gráfica Distribución T de Student
134
Distribución Ji-Cuadrado
  • Características
  • Nexo entre las varianzas de la población y la
    muestral.
  • Suma de n Normales estándares elevadas al
    cuadrado
  • Toma valores positivos
  • Asimétrica
  • Se desplaza a la derecha en función de los grados
    de libertad

135
Distribución Ji-Cuadrado
  • Parámetros
  • gl (Grados de libertad)
  • Distribución gamma con parámetro de forma
    a gl/2 y de escala ? 2.
  • Valor esperado
  • E(X) gl
  • Varianza
  • V(X) 2gl
  • Función de distribución acumulada en el SAS
  • PROBCHI(x, gl)
  • Inversa
  • CINV(p, gl)
  • Que es la más útil en el muestreo donde gl
    significa grados de libertad.

136
Distribución Ji-Cuadrado
Write a Comment
User Comments (0)
About PowerShow.com