Inferencia Estadstica - PowerPoint PPT Presentation

1 / 60
About This Presentation
Title:

Inferencia Estadstica

Description:

Una empresa de comercializaci n de semillas desea estimar la altura promedio de ... est m s cerca de . a medida que crece. el tama o de la muestra ... – PowerPoint PPT presentation

Number of Views:117
Avg rating:3.0/5.0
Slides: 61
Provided by: agroU
Category:

less

Transcript and Presenter's Notes

Title: Inferencia Estadstica


1
Inferencia Estadística
Estimación de Parámetros
2
Estimación
  • Buscar valores razonables para los parámetros
    que caracterizan una distribución

Si la distribución supuesta es normal, los
parámetros más buscados son la esperanza o media
(µ) y la varianza (?2)
3
Ejemplo
Una empresa de comercialización de semillas desea
estimar la altura promedio de un sorgo forrajero
que ha desarrollado. Para ello se toma una
muestra de 50 plantas y se calcula la media de la
altura, la que resulta ser de 130 cm.
4
Estimación
  • estimación puntual
  • por intervalo de confianza

5
Estimación Puntual
la media muestral es un estimador
Insesgado
Consistente
Eficiente
  • su promedio es
  • igual a µ

está más cerca de µ a medida que crece el tamaño
de la muestra
es más eficiente que la mediana por tener menor
varianza
de la media poblacional
6
Intervalos de Confianza
  • Encontrar el intervalo cerrado
  • LI, LS
  • donde LI Límite Inferior
  • LS Límite Superior
  • Entonces
  • P(LI ? LS) 1-?

7
Intervalo de Confianza para µ
  • Si 1-? 0.95, puede interpretarse
  • como
  • si se tomaran todas las muestras posibles de
    tamaño n y se construyeran 100 intervalos, 95
    incluirán a la verdadera media poblacional µ y
    sólo 5 no la contendrán

8
Ejemplo
Se sabe que ?22 cm.
Un intervalo para estimar a ? con una confianza
del 95, es
El verdadero valor de la altura promedio del
sorgo estará en este intervalo con un 95 de
confianza
9
Ejemplo
Un intervalo para estimar a ? con una confianza
del 99, es
El verdadero valor de la altura promedio del
sorgo estará en este intervalo con un 99 de
confianza
10
Efecto del cambio en el nivel de confianza
Sea la amplitud a LS LI
Si la confianza es del 95
a 136.05 123.95 12.1
Si la confianza es del 99
a 138.01 121.98 16.03
A mayor confianza mayor amplitud
11
Efecto del cambio en el tamaño de la muestra
Para una confianza del 99 y n 50
a 138.01 121.98 16.03
Si n 100
a 135.67 124.33 11.34
A mayor n menor amplitud
12
Conclusión
La amplitud de un intervalo de confianza es
directamente proporcional a la confianza de la
estimación e inversamente proporcional al tamaño
de la muestra
13
Intervalos de Confianza
  • Efecto del coeficiente de confianza y del tamaño
    muestral sobre la amplitud del intervalo

Tamaño muestral necesario para estimar un
parámetro con una precisión deseada
14
Tamaño de Muestra para estimar a µ con una
precisión deseada
Cuál debería ser el tamaño mínimo de muestra,
para que la amplitud no supere los 12.1 cm,
cuando se aumenta la confianza al 99?
15
Tamaño de Muestra para estimar a µ con una
precisión deseada
Donde c es la amplitud del intervalo de confianza
16
Ejemplo
Se debería tomar una muestra de al menos 88
plantas para que al estimar la altura promedio
del sorgo forrajero con una confianza del 99 la
amplitud del intervalo no sea mayor a 12,1
17
Otro ejemplo
Se desea utilizar un suelo cuya profundidad no
sea inferior a 75cm
Intervalos de confianza Bilateral Estimación
paramétrica Campos Variable Parám. Estim.
E.E. n LI(95) LS(95) A
prof Media 81,79 2,35 14 76,71 86,86

B prof Media
79,43 2,62 14 73,77 85,08
18
Otro ejemplo
Intervalos de confianza Unilateral
izquierdo Estimación paramétrica Campos
Variable Parám. Estim. E.E. n LI(95) A
prof Media 81,79 2,35 14
77,63
B prof Media
79,43 2,62 14 74,79
19
Inferencia basada en una muestra
Contraste de Hipótesis
20
Hipótesis nula (H0)
Hipótesis estadísticas
  • Son proposiciones sobre uno o más parámetros de
    la distribución de la variable aleatoria en
    estudio.

Hipótesis alternativa (H1)
establece valores o relaciones sobre uno o más
parámetros
niega la hipótesis nula
21
Ejemplo profundidad del suelo
Prueba T para un parámetro Valor del parámetro
probado 75 campos Variable n Media DE
LI(95) T p(Unilateral D) A
prof 14 81,79 8,79 77,63 2,89
0,0063
B prof
14 79,43 9,80 74,79 1,69 0,0573
22
Inferencia basada en dos muestras
Estimación de Parámetros
Contraste de Hipótesis
23
Inferencia basada en dos muestras
  • Contrastar hipótesis sobre la diferencia entre
    dos medias

Si el contraste es bilateral
versus
24
Caso Normal-Muestras independientes
Varianzas desconocidas pero iguales
  • La inferencia se basa en el siguiente
    estadístico

prueba T para muestras independientes cuando las
varianzas son homogéneas
25
Caso Normal-Muestras independientes
Varianzas desconocidas pero iguales
  • Intervalo de confianza bilateral para la
    diferencia de medias está dado por

26
Ejemplo
  • Para comparar el contenido promedio de aceites de
    las semillas de dos variedades de maní, se
    plantean las hipótesis H0 ?1 ?2 vs H1 ?1 ? ?2

Se diseña un ensayo en el que para cada variedad
se obtienen los contenidos de aceite de 10 bolsas
de 1 kg de semillas de maní, extraídas
aleatoriamente de distintos productores de
semillas.
27
Ejemplo
  • Los resultados del ensayo son los siguientes

28
Cómo saber si las varianzas son iguales o
diferentes?
  • Suponiendo normalidad para las observaciones de
    las muestras, una prueba de homogeneidad de
    varianzas se basa en el estadístico

29
Cómo saber si las varianzas son iguales o
diferentes?
versus
Bajo H0 se distribuye como una F con 9 y 9 grados
de libertad
30
Prueba F
La región de aceptación para un nivel de
significación del 5 está delimitada por 0.248 y
4.03, correspondientes a los cuantiles ?/2 y (1 -
?/2) respectivamente
31
Ejemplo
Como F0.96 está en el intervalo (0.248 4.03)
se acepta H0 ?12 ?22
Se concluye que no hay diferencias entre las
varianzas poblacionales, lo que indica el
cumplimiento del supuesto de homogeneidad de
varianzas
32
Prueba T para la diferencia de medias
33
Prueba T
La región de aceptación para un nivel de
significación del 5 está delimitada por -2.101 y
2.101, correspondientes a los cuantiles ?/2 y (1
- ?/2) respectivamente y 18 grados de libertad
34
Prueba T
Como T-1.42 está en el intervalo (-2.101
2.101) se acepta H0 ?1 ?2
Se concluye que no hay diferencias entre las dos
variedades de maní considerando el contenido de
aceites en la semilla
35
Caso Normal-Muestras independientes
Varianzas desconocidas y diferentes
  • La inferencia se basa en el estadístico

prueba T para muestras independientes cuando
las varianzas no son homogéneas
36
Caso Normal-Muestras independientes
Varianzas desconocidas y diferentes
  • Intervalo de confianza bilateral 1-? para la
    diferencia de medias está dado por

37
Prueba T Otro ejemplo
Comparar el efecto de la restriccion alimentaria
sobre los metabolitos Ca y P. Se realiza un
experimento en el cual se seleccionan al azar 10
animales para cada tratamiento alimentación
restrigida y alimentación no restringida. En cada
animal se mide el nivel de Ca y de P.
38
Prueba T - Muestras independientes
Clasific Variable Grupo(1) Grupo(2) n(1)
n(2) Trat Ca No Restr Restr
10 10 media(1) media(2) LI(95) LS(95) 8,87
8,68 -0,71
1,09 Varianza(1) Varianza(2) p(Var.Hom.)
T gl 1,33 0,49
0,1490 0,45 18 p prueba 0,6612
Bilateral
39
Prueba T - Muestras independientes
Clasific Variable Grupo(1) Grupo(2) n(1)
n(2) Trat P No Restr Restr
10 10 media(1) media(2)
LI(95) LS(95) 7,92 8,00
-1,03 0,86 Varianza(1)
Varianza(2) p(Var.Hom.) T gl
1,65 0,23 0,0072 -0,19 12
p prueba 0,8530 Bilateral
40
Prueba T - Muestras independientes Ejemplo
suplemento con lecitina
Clasific Variable Grupo(1) Grupo(2) n(1) Lecitina
lts./dia CON SIN 9 n(2) media(1) me
dia(2) LI(95) LS(95) 8 17,71 14,45
2,30 4,22 Varianza(1) Varianza(2) p(Var.Hom.)
0,75 0,97
0,7215 T gl p prueba
7,25 15 lt0,0001 Bilateral
41
Prueba T - Muestras independientes Ejemplo
suplemento con lecitina
Clasific Variable Grupo(1) Grupo(2) Lecitina lts./
dia CON SIN n(1) n(2) media(1) media(2)
LI(95)LS(95) 9 8 17,71 14,45
2,47 sd Varianza(1) Varianza(2)
p(Var.Hom.) 0,75 0,97
0,7215 T gl p prueba
7,25 15 lt0,0001 UnilatD
42
Caso Normal- Muestras dependientes
  • Los datos se obtienen de muestras que están
    relacionadas, es decir, los resultados del primer
    grupo no son independientes de los del segundo.
  • Por ejemplo, esto ocurre cuando se mide el nivel
    de un metabolito en cada uno de los individuos de
    un grupo experimental antes y después de la
    administración de una droga.

43
Caso Normal- Muestras dependientes
  • El objetivo es comprobar si la droga produce
    efectos en el nivel del metabolito
  • Los pares de observaciones (antes y después)
    obtenidas en cada individuo no son independientes
    ya que el nivel posterior a la administración de
    la droga depende del nivel inicial.

44
Caso Normal- Muestras dependientes
  • La inferencia se basa en el siguiente
    estadístico, que depende de la media y la
    varianza de las diferencias y del valor
    hipotetizado para el promedio poblacional de las
    diferencias (?)

45
Caso Normal- Muestras dependientes
  • La prueba de hipótesis para la diferencia de
    medias se conoce como prueba T para muestras
    apareadas.
  • Intervalo de confianza bilateral 1-? para la
    diferencia de medias (?) está dado por

46
Caso Normal- Muestras dependientesEjemplo
ANTES DESPUES DIF 8,69 7,24
1,45 7,13 7,10 0,03 7,79
7,80 -0,01 7,93 7,95 -0,02 7,59
7,50 0,09 7,86 7,79
0,07 9,06 9,00 0,06 9,59
9,48 0,11
47
Caso Normal- Muestras dependientesEjemplo
Prueba T (muestras apareadas) Obs(1) Obs(2)
N media(dif) ANTES DESPUES 8
0,22 DE(dif) LI(95) LS(95) T 0,50
-0,19 0,64 1,26 Bilateral
0,2469
48
Errores en la Prueba de Hipótesis
  • Tanto cuando no se rechaza la hipótesis nula como
    cuando se rechaza, es posible cometer errores

49
Errores
Frente a una hipótesis nula se toma una decisión
Aceptar H0
o
Rechazar H0
50
Error de tipo I
  • Error de Tipo I
  • la hipótesis nula es cierta y se rechaza
    erróneamente
  • La probabilidad de cometer este tipo de error
    está bajo control del experimentador. Su máximo
    valor se simboliza con ? y recibe el nombre de
    nivel de significación

51
Error de tipo II
  • Error de Tipo II
  • la hipótesis nula es falsa y no se rechaza
  • La probabilidad (?) de cometer este tipo de error
    queda determinada por
  • el nivel de significación elegido
  • el tamaño muestral
  • la magnitud de la discrepancia entre la hipótesis
    postulada y la situación verdadera.

52
Error Tipo II
53
Potencia
  • Se define a la potencia como
  • ? 1 - Probabilidad de error de Tipo II
  • Esta probabilidad es una medida de la
    potencialidad que se tiene en un experimento para
    detectar que la hipótesis nula es falsa.

? 1- ?
54
Regresión Lineal
  • Modelar la relación entre dos o más variables
  • La variable respuesta es la dependiente y las
    otras variables son las independientes o
    regresoras
  • Estimar los parámetros del modelo
  • Probar hipótesis sobre los parámetros
  • Predecir el nivel medio de la respuesta para
    determinados valores de las regresoras

55
Regresión Lineal
Ejemplo Estudiar la relación entre la longitud
de la planta y la temperatura
56
Regresión Lineal
Modelo propuesto
Variable respuesta (longitud)
Ordenada al origen Valor de Y para X0
Error aleatorio
Variable independiente (temperatura)
Pendiente Tasa de cambio en Y (longitud) ante el
cambio unitario en X (temperatura)
57
Regresión Lineal
Variable N R² LP (mm)
19 0,60 Coeficientes de regresión y
estadísticos asociados Coef Est. EE
LI(95) LS(95) T p-valor const 8,69
2,54 3,32 14,06 3,42 0,0033 Temp
0,72 0,14 0,42 1,02 5,04
0,0001 Cuadro de Análisis de la Varianza (SC
tipo III) F.V. SC gl CM
F p-valor Temp (C) 317,86 1 317,86
25,41 0,0001 Error 212,66 17 12,51
Total 530,53 18
58
Regresión Lineal
Modelo ajustado
Valor predicho para x 22 C
59
Regresión Lineal
60
Regresión Lineal
Variable N R² LP (mm) 19 0,60
Valor predictivo del modelo ajustado
Proporción de la variabilidad total explicada por
el modelo.
El 60 de la suma de cuadrados totales de la
variable longitud es explicada a través de una
relación lineal, por la variación observada en la
temperatura.
Write a Comment
User Comments (0)
About PowerShow.com