Title: Inferencia Estadstica
1Inferencia EstadÃstica
Estimación de Parámetros
2 Estimación
- Buscar valores razonables para los parámetros
que caracterizan una distribución
Si la distribución supuesta es normal, los
parámetros más buscados son la esperanza o media
(µ) y la varianza (?2)
3Ejemplo
Una empresa de comercialización de semillas desea
estimar la altura promedio de un sorgo forrajero
que ha desarrollado. Para ello se toma una
muestra de 50 plantas y se calcula la media de la
altura, la que resulta ser de 130 cm.
4Estimación
- por intervalo de confianza
5Estimación Puntual
la media muestral es un estimador
Insesgado
Consistente
Eficiente
- su promedio es
- igual a µ
está más cerca de µ a medida que crece el tamaño
de la muestra
es más eficiente que la mediana por tener menor
varianza
de la media poblacional
6Intervalos de Confianza
- Encontrar el intervalo cerrado
- LI, LS
- donde LI LÃmite Inferior
- LS LÃmite Superior
- Entonces
- P(LI ? LS) 1-?
7Intervalo de Confianza para µ
- Si 1-? 0.95, puede interpretarse
- como
- si se tomaran todas las muestras posibles de
tamaño n y se construyeran 100 intervalos, 95
incluirán a la verdadera media poblacional µ y
sólo 5 no la contendrán
8Ejemplo
Se sabe que ?22 cm.
Un intervalo para estimar a ? con una confianza
del 95, es
El verdadero valor de la altura promedio del
sorgo estará en este intervalo con un 95 de
confianza
9Ejemplo
Un intervalo para estimar a ? con una confianza
del 99, es
El verdadero valor de la altura promedio del
sorgo estará en este intervalo con un 99 de
confianza
10Efecto del cambio en el nivel de confianza
Sea la amplitud a LS LI
Si la confianza es del 95
a 136.05 123.95 12.1
Si la confianza es del 99
a 138.01 121.98 16.03
A mayor confianza mayor amplitud
11Efecto del cambio en el tamaño de la muestra
Para una confianza del 99 y n 50
a 138.01 121.98 16.03
Si n 100
a 135.67 124.33 11.34
A mayor n menor amplitud
12Conclusión
La amplitud de un intervalo de confianza es
directamente proporcional a la confianza de la
estimación e inversamente proporcional al tamaño
de la muestra
13Intervalos de Confianza
- Efecto del coeficiente de confianza y del tamaño
muestral sobre la amplitud del intervalo
Tamaño muestral necesario para estimar un
parámetro con una precisión deseada
14Tamaño de Muestra para estimar a µ con una
precisión deseada
Cuál deberÃa ser el tamaño mÃnimo de muestra,
para que la amplitud no supere los 12.1 cm,
cuando se aumenta la confianza al 99?
15Tamaño de Muestra para estimar a µ con una
precisión deseada
Donde c es la amplitud del intervalo de confianza
16Ejemplo
Se deberÃa tomar una muestra de al menos 88
plantas para que al estimar la altura promedio
del sorgo forrajero con una confianza del 99 la
amplitud del intervalo no sea mayor a 12,1
17Otro ejemplo
Se desea utilizar un suelo cuya profundidad no
sea inferior a 75cm
Intervalos de confianza Bilateral Estimación
paramétrica Campos Variable Parám. Estim.
E.E. n LI(95) LS(95) A
prof Media 81,79 2,35 14 76,71 86,86
B prof Media
79,43 2,62 14 73,77 85,08
18Otro ejemplo
Intervalos de confianza Unilateral
izquierdo Estimación paramétrica Campos
Variable Parám. Estim. E.E. n LI(95) A
prof Media 81,79 2,35 14
77,63
B prof Media
79,43 2,62 14 74,79
19Inferencia basada en una muestra
Contraste de Hipótesis
20Hipótesis nula (H0)
Hipótesis estadÃsticas
- Son proposiciones sobre uno o más parámetros de
la distribución de la variable aleatoria en
estudio.
Hipótesis alternativa (H1)
establece valores o relaciones sobre uno o más
parámetros
niega la hipótesis nula
21Ejemplo profundidad del suelo
Prueba T para un parámetro Valor del parámetro
probado 75 campos Variable n Media DE
LI(95) T p(Unilateral D) A
prof 14 81,79 8,79 77,63 2,89
0,0063
B prof
14 79,43 9,80 74,79 1,69 0,0573
22Inferencia basada en dos muestras
Estimación de Parámetros
Contraste de Hipótesis
23Inferencia basada en dos muestras
- Contrastar hipótesis sobre la diferencia entre
dos medias
Si el contraste es bilateral
versus
24Caso Normal-Muestras independientes
Varianzas desconocidas pero iguales
- La inferencia se basa en el siguiente
estadÃstico
prueba T para muestras independientes cuando las
varianzas son homogéneas
25Caso Normal-Muestras independientes
Varianzas desconocidas pero iguales
- Intervalo de confianza bilateral para la
diferencia de medias está dado por
26Ejemplo
- Para comparar el contenido promedio de aceites de
las semillas de dos variedades de manÃ, se
plantean las hipótesis H0 ?1 ?2 vs H1 ?1 ? ?2
Se diseña un ensayo en el que para cada variedad
se obtienen los contenidos de aceite de 10 bolsas
de 1 kg de semillas de manÃ, extraÃdas
aleatoriamente de distintos productores de
semillas.
27Ejemplo
- Los resultados del ensayo son los siguientes
28Cómo saber si las varianzas son iguales o
diferentes?
- Suponiendo normalidad para las observaciones de
las muestras, una prueba de homogeneidad de
varianzas se basa en el estadÃstico
29Cómo saber si las varianzas son iguales o
diferentes?
versus
Bajo H0 se distribuye como una F con 9 y 9 grados
de libertad
30Prueba F
La región de aceptación para un nivel de
significación del 5 está delimitada por 0.248 y
4.03, correspondientes a los cuantiles ?/2 y (1 -
?/2) respectivamente
31Ejemplo
Como F0.96 está en el intervalo (0.248 4.03)
se acepta H0 ?12 ?22
Se concluye que no hay diferencias entre las
varianzas poblacionales, lo que indica el
cumplimiento del supuesto de homogeneidad de
varianzas
32Prueba T para la diferencia de medias
33Prueba T
La región de aceptación para un nivel de
significación del 5 está delimitada por -2.101 y
2.101, correspondientes a los cuantiles ?/2 y (1
- ?/2) respectivamente y 18 grados de libertad
34Prueba T
Como T-1.42 está en el intervalo (-2.101
2.101) se acepta H0 ?1 ?2
Se concluye que no hay diferencias entre las dos
variedades de manà considerando el contenido de
aceites en la semilla
35Caso Normal-Muestras independientes
Varianzas desconocidas y diferentes
- La inferencia se basa en el estadÃstico
prueba T para muestras independientes cuando
las varianzas no son homogéneas
36Caso Normal-Muestras independientes
Varianzas desconocidas y diferentes
- Intervalo de confianza bilateral 1-? para la
diferencia de medias está dado por
37Prueba T Otro ejemplo
Comparar el efecto de la restriccion alimentaria
sobre los metabolitos Ca y P. Se realiza un
experimento en el cual se seleccionan al azar 10
animales para cada tratamiento alimentación
restrigida y alimentación no restringida. En cada
animal se mide el nivel de Ca y de P.
38Prueba T - Muestras independientes
Clasific Variable Grupo(1) Grupo(2) n(1)
n(2) Trat Ca No Restr Restr
10 10 media(1) media(2) LI(95) LS(95) 8,87
8,68 -0,71
1,09 Varianza(1) Varianza(2) p(Var.Hom.)
T gl 1,33 0,49
0,1490 0,45 18 p prueba 0,6612
Bilateral
39Prueba T - Muestras independientes
Clasific Variable Grupo(1) Grupo(2) n(1)
n(2) Trat P No Restr Restr
10 10 media(1) media(2)
LI(95) LS(95) 7,92 8,00
-1,03 0,86 Varianza(1)
Varianza(2) p(Var.Hom.) T gl
1,65 0,23 0,0072 -0,19 12
p prueba 0,8530 Bilateral
40Prueba T - Muestras independientes Ejemplo
suplemento con lecitina
Clasific Variable Grupo(1) Grupo(2) n(1) Lecitina
lts./dia CON SIN 9 n(2) media(1) me
dia(2) LI(95) LS(95) 8 17,71 14,45
2,30 4,22 Varianza(1) Varianza(2) p(Var.Hom.)
0,75 0,97
0,7215 T gl p prueba
7,25 15 lt0,0001 Bilateral
41Prueba T - Muestras independientes Ejemplo
suplemento con lecitina
Clasific Variable Grupo(1) Grupo(2) Lecitina lts./
dia CON SIN n(1) n(2) media(1) media(2)
LI(95)LS(95) 9 8 17,71 14,45
2,47 sd Varianza(1) Varianza(2)
p(Var.Hom.) 0,75 0,97
0,7215 T gl p prueba
7,25 15 lt0,0001 UnilatD
42Caso Normal- Muestras dependientes
- Los datos se obtienen de muestras que están
relacionadas, es decir, los resultados del primer
grupo no son independientes de los del segundo.
- Por ejemplo, esto ocurre cuando se mide el nivel
de un metabolito en cada uno de los individuos de
un grupo experimental antes y después de la
administración de una droga.
43Caso Normal- Muestras dependientes
- El objetivo es comprobar si la droga produce
efectos en el nivel del metabolito
- Los pares de observaciones (antes y después)
obtenidas en cada individuo no son independientes
ya que el nivel posterior a la administración de
la droga depende del nivel inicial.
44Caso Normal- Muestras dependientes
- La inferencia se basa en el siguiente
estadÃstico, que depende de la media y la
varianza de las diferencias y del valor
hipotetizado para el promedio poblacional de las
diferencias (?)
45Caso Normal- Muestras dependientes
- La prueba de hipótesis para la diferencia de
medias se conoce como prueba T para muestras
apareadas.
- Intervalo de confianza bilateral 1-? para la
diferencia de medias (?) está dado por
46Caso Normal- Muestras dependientesEjemplo
ANTES DESPUES DIF 8,69 7,24
1,45 7,13 7,10 0,03 7,79
7,80 -0,01 7,93 7,95 -0,02 7,59
7,50 0,09 7,86 7,79
0,07 9,06 9,00 0,06 9,59
9,48 0,11
47Caso Normal- Muestras dependientesEjemplo
Prueba T (muestras apareadas) Obs(1) Obs(2)
N media(dif) ANTES DESPUES 8
0,22 DE(dif) LI(95) LS(95) T 0,50
-0,19 0,64 1,26 Bilateral
0,2469
48Errores en la Prueba de Hipótesis
- Tanto cuando no se rechaza la hipótesis nula como
cuando se rechaza, es posible cometer errores
49Errores
Frente a una hipótesis nula se toma una decisión
Aceptar H0
o
Rechazar H0
50Error de tipo I
- Error de Tipo I
- la hipótesis nula es cierta y se rechaza
erróneamente - La probabilidad de cometer este tipo de error
está bajo control del experimentador. Su máximo
valor se simboliza con ? y recibe el nombre de
nivel de significación
51Error de tipo II
- Error de Tipo II
- la hipótesis nula es falsa y no se rechaza
- La probabilidad (?) de cometer este tipo de error
queda determinada por - el nivel de significación elegido
- el tamaño muestral
- la magnitud de la discrepancia entre la hipótesis
postulada y la situación verdadera.
52Error Tipo II
53Potencia
- Se define a la potencia como
- ? 1 - Probabilidad de error de Tipo II
- Esta probabilidad es una medida de la
potencialidad que se tiene en un experimento para
detectar que la hipótesis nula es falsa.
? 1- ?
54Regresión Lineal
- Modelar la relación entre dos o más variables
- La variable respuesta es la dependiente y las
otras variables son las independientes o
regresoras - Estimar los parámetros del modelo
- Probar hipótesis sobre los parámetros
- Predecir el nivel medio de la respuesta para
determinados valores de las regresoras
55Regresión Lineal
Ejemplo Estudiar la relación entre la longitud
de la planta y la temperatura
56Regresión Lineal
Modelo propuesto
Variable respuesta (longitud)
Ordenada al origen Valor de Y para X0
Error aleatorio
Variable independiente (temperatura)
Pendiente Tasa de cambio en Y (longitud) ante el
cambio unitario en X (temperatura)
57Regresión Lineal
Variable N R² LP (mm)
19 0,60 Coeficientes de regresión y
estadÃsticos asociados Coef Est. EE
LI(95) LS(95) T p-valor const 8,69
2,54 3,32 14,06 3,42 0,0033 Temp
0,72 0,14 0,42 1,02 5,04
0,0001 Cuadro de Análisis de la Varianza (SC
tipo III) F.V. SC gl CM
F p-valor Temp (C) 317,86 1 317,86
25,41 0,0001 Error 212,66 17 12,51
Total 530,53 18
58Regresión Lineal
Modelo ajustado
Valor predicho para x 22 C
59Regresión Lineal
60Regresión Lineal
Variable N R² LP (mm) 19 0,60
Valor predictivo del modelo ajustado
Proporción de la variabilidad total explicada por
el modelo.
El 60 de la suma de cuadrados totales de la
variable longitud es explicada a través de una
relación lineal, por la variación observada en la
temperatura.