Title: Estad
1EstadísticaMaestría en FinanzasMercado de
Capitales
- Alberto Landro
- Pablo M. Federico
Pablo M. Federico Clase 5
2Clase 5
Test de Hipotesis
Pablo M. Federico Clase 5
31. Test de Hipotesis
- Existen 3 técnicas básicas dentro de la
inferencia estadística clásica - 1. Estimación puntual.
- 2. Estimación por intervalos.
- 3. Test de hipótesis.
- Ya trabajamos con estimación puntual y por
intervalos. Hoy vamos a ver la aplicación de los
test de hipotesis, los cuales también nos
ayudarán en nuestro objetivo último, el cual es
obtener conclusiones sobre determinados
parámetros - poblacionales.
Pablo M. Federico Clase 5
41. Test de Hipotesis
- Un test de hipótesis puede ser entendido como un
procedimiento estadístico simple cuya finalidad
es corroborar o desmentir alguna afirmación que
se hace con relación a un parámetro poblacional.
En definitiva, es una regla de decisión sobre
determinadas características de los parámetros
poblacionales de nuestro interés. - Recordemos entonces los principales elementos
que se relacionan en la construcción de un test
de hipótesis. - Hipótesis nula Se llama así a una suposición
inicial sobre el parámetro poblacional bajo
estudio que sirve para iniciar el procedimiento
de prueba o verificación. Generalmente se usa el
símbolo H0 para denotar la hipótesis nula. - Hipótesis alternativa Es la hipótesis que se
establece como alternativa de la hipótesis nula
si la H0 es rechazada, entonces será la hipótesis
alternativa la que se tomará tentativamente como
válida, y viceversa. - Se usa el símbolo H1 o HA para denotar la
hipótesis alternativa.
Pablo M. Federico Clase 5
51. Test de Hipotesis
- Planteadas ambas hipótesis (H0 y H1), lo
primordial al realizar el - test es recordar que pueden darse 4 situaciones
- Los errores que pueden cometerse son
- Error de tipo I Consiste en rechazar una
hipótesis que es cierta y que, por lo tanto,
debería haberse aceptado. - Error de tipo II Consiste en aceptar una
hipótesis que es falsa y que, por lo tanto,
debería haberse rechazado.
Pablo M. Federico Clase 5
61. Test de Hipotesis
- Un test de hipótesis debe ser construido de
forma tal que la hipótesis nula sea o no
rechazada. Se dice entonces que H0 es la
hipótesis a ser probada. Sin embargo, con la
inclusión de la hipótesis alternativa, puede ser
mas descriptivo decir que probar una hipótesis
estadística es proporcionar una regla de decisión
entre H0 y H1. Por ello, se debe ejercer una
precaución extrema al establecer las hipótesis
nula y alternativa. - Recurramos a una analogía. En un proceso
judicial, un acusado es inocente hasta que no se
demuestre lo contrario. Si la hipótesis nula es
inocente, entonces, con toda seguridad, la
hipótesis alternativa es culpable. El rechazo
de la hipótesis nula, implicaría que el juicio ha
sido capaz de proporcionar suficiente evidencia
para garantizar un veredicto culpable. Por otro
lado, si el juicio no presenta evidencia
sustancial, el veredicto será inocente. Esta
decisión no implica necesariamente que el acusado
sea inocente, más bien hace énfasis en la falta
de evidencia sustancial necesaria para condenar
al acusado.
Pablo M. Federico Clase 5
71. Test de Hipotesis
- Por lo tanto, en cierto sentido, un veredicto de
culpabilidad ante un inocente (el rechazo de H0
cuando ésta es verdadera) debe considerarse como
una decisión más fuerte que un veredicto de
inocencia a un culpable (equivocarse al no
rechazar H0 cuando es falsa), lo cual surge del
principio judicial generalmente aceptado de que
es peor condenar a una persona inocente que dejar
libre a una culpable. - Si el veredicto es culpable, se deseará tener un
grado muy alto de seguridad de que no se va a
condenar a una persona inocente. Por lo tanto, en
muchas situaciones, el error del tipo I se
considera como un error mucho más grave que el
error de tipo II.
Pablo M. Federico Clase 5
81. Test de Hipotesis
Pablo M. Federico Clase 5
91. Test de Hipotesis
- Nivel de significación de una prueba Se llama
así a la probabilidad máxima de cometer un error
de tipo I. A dicha probabilidad se la suele
denotar con la letra griega a. - Lo más usual es que al principio uno establezca
cuál es el valor de a que desea aplicar en la
prueba. Es común tomar los valores a 0,05 o
bien a 0,01. A la probabilidad máxima de
cometer un error de tipo II se le denota con la
letra griega ß. - Un test de hipótesis se llama bilateral (o de
dos colas) cuando la hipótesis alternativa
involucra el signo ? para el parámetro que se
somete a prueba. - Un test de hipótesis se llama unilateral (o de
una cola) cuando la hipótesis alternativa
involucra el signo lt (test unilateral
izquierdo) o bien el signo gt (test unilateral
derecho).
Pablo M. Federico Clase 5
101. Test de Hipotesis
- A fin de realizar un test de hipótesis sobre un
parámetro poblacional, es recomendable seguir los
siguientes 5 pasos - P1. Emitir una hipótesis nula (H0) relativa a
algún parámetro de la población. La hipótesis
debe involucrar alguno de los signos , o
, pero no puede involucrar ninguno de los
signos lt, gt, ni tampoco ?. - P2. Especificar un nivel de significación a a
emplear. Lo convencional es emplear los niveles
del 5 ( a 0,05) o del 1 ( a 0,01). - P3. Extraer de la población una muestra aleatoria
de tamaño n, y calcular el estadístico de prueba
apropiado (z, t, etc.). - P4. Comparar el valor numérico obtenido para el
estadístico de prueba con un valor tabulado
(valor crítico -z, t, etc.-) de la distribución
estadística teórica correspondiente. - P5. Decidir si se rechaza o no la hipótesis nula.
Pablo M. Federico Clase 5
111. Test de Hipotesis
- Veamos tres casos de tests para la media
poblacional - 1- Los paquetes de harina marca XYZ de medio
kilogramo afirman contener en su etiqueta un
contenido neto de 500 gr. Supongamos que deseamos
evaluar dicha afirmación a partir de nuestra
creencia de que los paquetes contienen menor
cantidad de harina. Para ello, se eligen al azar
50 paquetes y se los pesa con una balanza de
precisión, obteniendo los siguientes datos
muestrales - 492 gr.
- S 34,4 gr.
- Planteamos entonces la hipótesis nula y
alternativa - H0 m 500 gr.
- H1 m lt 500 gr..
- Para la realización del test, usaremos un nivel
de significación del a 0,05.
Pablo M. Federico Clase 5
121. Test de Hipotesis
Aunque desconocemos cómo se distribuye el peso de
los paquetes, por tratarse de una muestra grande
(n gt 30) usaremos la distribución normal estándar
a fin de hallar nuestro valor crítico. Para un
nivel de significación de 0,05 la tabla
correspondiente arroja un valor de z
-1,645.
Pablo M. Federico Clase 5
131. Test de Hipotesis
El estadístico que utilizaremos
es Reemplazando en el mismo por los datos del
ejercicio se obtiene que z (492 - 500) / (34,4
/ 7,07) -1,644 Dado que -1,645 lt -1,6444 el
valor calculado del estadístico de prueba no
alcanza a caer en zona de rechazo. Por lo tanto,
al nivel de significación del 5 no se puede
rechazar la hipótesis nula. Es decir, no existen
argumentos para afirmar que los paquetes de
harina XYZ contienen (en promedio) menos que lo
anunciado en sus etiquetas.
Pablo M. Federico Clase 5
141. Test de Hipotesis
2- En cierto país se estableció que hace 20 años
el promedio de vida de una persona era de 71,4
años. Recientemente, se tomó una muestra
aleatoria de 100 muertes, y se obtuvo que
73,8 años. S 9,8 años. Se puede argumentar
que actualmente la gente vive, en promedio, más
que hace 20 años? Planteamos entonces la
hipótesis nula y alternativa H0 m 71,4
años H1 m gt 71,4 años. Para la realización
del test, usaremos un nivel de significación del
a 0,05.
Pablo M. Federico Clase 5
151. Test de Hipotesis
Para un nivel de significación de 0,05 la tabla
correspondiente arroja un valor de z 1,645. El
estadístico que utilizaremos es, nuevamente
Reemplazando en el mismo por los datos del
ejercicio se obtiene que z (73,8 - 71,4) /
(9,8 / 10) 2,448 Dado que 2,448 gt 1,645 el
valor calculado del estadístico de prueba cae en
zona de rechazo. Por lo tanto, al nivel de
significación del 5 se puede rechazar la
hipótesis nula. Es decir, se rechaza H0 y se
concluye que los resultados de la muestra son
altamente significativos para argumentar que
actualmente las personas viven, en promedio, más
que hace 20 años.
Pablo M. Federico Clase 5
161. Test de Hipotesis
3- El departamento de seguridad de una fábrica
desea saber si el tiempo promedio real que
requiere un sereno para realizar su ronda
nocturna es de 30 minutos. Se tomó una muestra al
azar de 32 rondas y el sereno promedió 30,8
minutos con una desviación estándar de 1,7
minutos. 30,8 minutos. S 1,7
minutos. Realicemos un test de hipótesis con a
0,01, que permita averiguar si hay evidencia
suficiente para rechazar la hipótesis nula H0
m 30 minutos en favor de la hipótesis
alternativa H1 m ? 30 minutos
Pablo M. Federico Clase 5
171. Test de Hipotesis
A diferencia de los dos ejemplos anteriores, el
test es un ensayo bilateral o a dos colas. Los
valores de z críticos son aquellos con
respectivas áreas de 0,005 en sendas esquinas
bajo la curva, es decir, z 2.576. El
estadístico de prueba es nuevamente
Reemplazando en el mismo por los datos del
ejercicio se obtiene que z (30,8 - 30) /
(1,7 / 5,65) 2,662 Este valor cae en zona de
rechazo ya que es mayor que 2,576. Por lo tanto,
se rechaza la hipótesis de que el tiempo promedio
real que hace el sereno en sus rondas es de 30
minutos, en favor de la alternativa, por lo que
concluimos que es muy probable que el sereno haga
un tiempo promedio diferente a 30 minutos.
Pablo M. Federico Clase 5
181. Test de Hipotesis
- Al igual que en los casos de estimación por
intervalos, para muestras pequeñas con varianza
poblacional desconocida y población supuestamente
normal, se emplean las tablas de valores críticos
de la distribución t de Student con n-1 grados de
libertad. - Veamos un ejemplo. Supongamos que deseamos
analizar el tiempo promedio para entregar pizzas
en un barrio determinado ya que se cree que el
responsable de la sucursal miente al decir que
sus repartidores tardan, a lo sumo 40 minutos
para cualquier entrega dentro de la zona de
operaciones. Para realizar el test, se obtiene
una muestra aleatoria de 10 pedidos de pizza
(redondeados al minuto más cercano) 38, 48, 37,
39, 46, 46, 43, 42, 44 y 40 minutos.
Pablo M. Federico Clase 5
191. Test de Hipotesis
Si se supone distribución normal y deseamos
realizar el test de hipótesis con a 0,01,
ensayaremos la hipótesis nula H0m 40 contra
la hipótesis alternativa H1m gt 40 A partir de
los datos, se sabe que 42,3 minutos. S
3,743 minutos. Reemplazando en el estadístico de
prueba por los datos del ejercicio se obtiene
que t (42,3 - 40) / (3,743 / 3,162)
1,943 El valor crítico en la distribución t de
Student con ? 10 -1 9 grados es igual a
2,821. Como 1.943 es menor al t, no se puede
rechazar la afirmación del responsable del local
a un nivel de a 0,01.
Pablo M. Federico Clase 5
201. Test de Hipotesis
- Supongamos que ahora deseamos realizar un test
de hipótesis relativo a la varianza o la
desviación estándar poblacionales. Para ello,
deberemos usar el estadístico de prueba llamado
ji-cuadrado muestral, definido como sigue - En un test unilateral a la derecha (o de cola
derecha), la hipótesis nula será - H0s2 s20 o bien H0s2 s20
- y la hipótesis alternativa seráH1s2 gt s20
- Para un nivel de significación a, la región de
rechazo se busca en - tablas de la distribución ji-cuadrada con ? n
-1 grados de - libertad.
Pablo M. Federico Clase 5
211. Test de Hipotesis
- En cambio, en un test unilateral a la izquierda
(o de cola izquierda), la hipótesis nula es - H0s2 s20 o bien H0s2 s20,
- y la hipótesis alternativa es H1s2 lt s20
- Por último, para un test bilateral (o de dos
colas), se tiene - H0s2 s20 ,
- y la hipótesis alternativa es H1s20 ? s20
Pablo M. Federico Clase 5
221. Test de Hipotesis
- Veamos un ejemplo. Supongamos que estamos
analizando el tiempo (en minutos) de espera de
los clientes en la ventanilla de un banco. - Antes de un curso de capacitación para los
empleados de atención al público se sabía que la
desviación estándar era 2,3 minutos. Luego del
curso de capacitación, el tiempo de espera de 10
clientes tomados al azar fue de 1,8 5,2 4,3
6,6 2,5 3,4 2,6 5,6 4,7 y 4,0. - Por lo tanto
- H0s2 (2,3)2
- H1s2 lt (2,3)2
- con a 0,05. Sirvió el curso de capacitación
para disminuir la varianza de los tiempos de
espera?
Pablo M. Federico Clase 5
231. Test de Hipotesis
De los datos muestrales, hallamos que S 1,5166
minutos. A primera vista podríamos sospechar que
el curso sí sirvió, pero veamos el valor crítico
para la distribución ji-cuadrado con 9 grados de
libertad es de 3,32. Si reemplazamos en el
estadístico de prueba por los datos del
ejercicio, obtendremos que c 9 . (1,5166)2
/ 2,32 3,913 gt 3,32 Por lo tanto, no existe
suficiente evidencia estadística en contra de la
hipótesis H0, así que se concluye que
probablemente el curso de capacitación no sirvió
para disminuir la varianza de manera perceptible
(o significativa).
Pablo M. Federico Clase 5
241. Test de Hipotesis
- Ejercicios
- Ej 1. Con el fin de estimar la rentabilidad
diaria promedio del activo XXX se tomó una
muestra compuesta de 400 observaciones sobre sus
precios de cierre, obteniéndose los siguientes
resultados - Rentabilidad promedio 0.1563 Volatilidad
muestral 0.4795 - Teniendo en cuenta las condiciones de mercado
eficiente, se supone que las variables que
componen la población son independientes y todas
con distribución de probabilidades del tipo N(m,
s2), siendo m y s2 desconocidos para el
observador. - Se pide construir el intervalo de confiabilidad
para la rentabilidad diaria del activo XXX con un
nivel de significación del 90. - La consultora A asegura a sus clientes que la
rentabilidad diaria del activo XXX es en promedio
0.2, contra la opinión de la consultora B que
asegura que la rentabilidad diaria promedio es
menor que dicho valor. A partir de los resultados
vistos, testear la hipótesis de la consultora A
contra la de la consultora B con un nivel de
significación del 95.
Pablo M. Federico Clase 5
251. Test de Hipotesis
c) La consultora A asegura a sus clientes que
XXX tiene volatilidad y rentabilidad promedio
diaria similar a YYY, contra la opinión de la
consultora B que asegura que la rentabilidad
diaria promedio de YYY es mayor que la de XXX.
Con este fin se toma una muestra diaria de
tamaño 900 sobre las rentabilidades de YYY,
obteniéndose una rentabilidad diaria promedio
igual a 0.1701 y una varianza de las
rentabilidades diarias igual a 0.4924. Suponiendo
que las variables que corresponden a las
rentabilidades de YYY se distribuyen una normal
N(m, s2), testear la hipótesis de la consultora A
con un nivel de significación del 90.
Pablo M. Federico Clase 5
261. Test de Hipotesis
Ej 2. Se tomó una muestra de 15 observaciones
sobre la evolución de la acción ZZZ, cuyas
rentabilidades son variables independientes con
distribución N(m, s2) de la que se obtuvo que la
varianza de las rentabilidades es igual a
0.234. a) Se pide construir el intervalo de
confianza para la volatilidad diaria de ZZZ con
un nivel de significación del 90. b) La
consultora A asegura a sus clientes que la
volatilidad del activo ZZZ es igual a 0.17 contra
la opinión de la consultora B que asegura que
dicha volatilidad es mayor a 0.17. A partir de
los resultados de la muestra, testear la
hipótesis de la consultora A a un nivel de
significación del 95.
Pablo M. Federico Clase 5
271. Test de Hipotesis
Ej 3. Se realizó un estudio para comparar el
promedio del número de llamadas de emergencia a
la policia por turno de 8 hs, en dos distritos de
una ciudad. Se seleccionaron al azar muestras de
los registros policiacos para cada una de las
regiones, y se registro el numero de llamadas en
cada turno. Las estadísticas muestrales son las
siguientes a) Verifique la hipotesis
nula de que el promedio del numero de llamadas de
emergencia por turno es igual en los dos
distritos de la ciudad con una significacion del
5
Pablo M. Federico Clase 5
281. Test de Hipotesis
Ej 4. Un investigador ha preparado el nivel de
dosificación de un fármaco que afirma provocará
sueño en por lo menos el 80 de las personas que
padecen insomnio. Despues de examinar la
dosificación, se considera que su afirmación
acerca de la efectividad del fármaco es
exagerada. En un intento de refutar su
afirmación se administra la dosificación
prescrita a 20 personas que padecen insomnio, y
se observa Y, el numero de personas que se
adormecen debido al fármaco. Se desea probar la
hipotesis H0 p 0.08 frente a la alternativa
H1 p lt 0.8 Suponga que se utiliza la región de
rechazo (Ylt12) a) Encuentre a. b) Encuentre ß
para p 0.6
Pablo M. Federico Clase 5
291. Test de Hipotesis
Ej 5. Una agencia gubernamental recibe reclamos
de algunos consumidores sobre ciertas botellas de
amaretto vendidas por una empresa que contienen
menos de los 20 grados de alcohol de producto
publicados. Para verificar el reclamo de los
consumidores, la agencia compra 9 botellas y
encuentra que la media es de 18 grados y la
desvicación estándar de 3 grados. Como realizaría
el test esta agencia con un 5 de significación?
Pablo M. Federico Clase 5
301. Test de Hipotesis
Ej 6. Un gran comprador de lámparas de luz quiere
decidir cual de dos marcas de igual precio va a
comprar. Para ello, toma una muestra aleatoria de
100 lamparas de cada marca y encuentra que la
marca A tiene una duración media de 980 hs y un
desvío estándar de la muestra de 80 hs. Para la
marca B, la media es de 1010 hs y el devio
estandar de 120 hs. Que marca debería comprar si
quiere tomar la decision a un nivel de
significacion del 5? Y si el nivel de
sifnificacion fuera del 1?
Pablo M. Federico Clase 5
31Me pueden contactar en pablofeder_at_gmail.com Las
presentaciones estan colgadas en www.cema.edu.ar/
u/pmf03
Pablo M. Federico 21 de Marzo de 2007