Title: Bioestad
1Bioestadística Aplicada I
- NMRCD Programa GEIS
- UPCH FASPA
- ABE Perú
2Sexta clase
- Métodos paramétricos y no paramétricos
- Medias, varianza y correlación
- Pruebas para variables continuas
3Porqué usamos pruebas no paramétricas?
Porque no siempre se cumplen todos los supuestos
requeridos por las pruebas de hipótesis
tradicionales (paramétricas) Si la
distribucion de la poblacion es sesgada (Por lo
que la media no es buen indicador de tendencia
central)
- Distribución normal
- Tamaño de muestra grande
- Varianzas iguales (?)
4Cómo se aplican estas pruebas
- Aplicar una transformación a los datos
originales, convertiéndolos en rangos, valores
positivo o negativo, etc. - Con los datos transformados, calcular un
estadístico en base a los datos (a veces también
se calcula su promedio y error estándar) - Con el estadístico y los parámetros calculados,
realizar una prueba de hipótesis de acuerdo a una
cierta distribución paramétrica (Normal,
Ji-cuadrado, Binomial, etc.)
5Transformaciones de datos
- Si los datos tienen una distribución sesgada, en
ocasiones pueden transformarse para eliminar los
sesgos - En algunos casos se puede emplear un test
paramétrico después de la transformación
6Ejemplo
- Si trabajamos con parasitemia, con frecuencia
tendremos que aplicar una transformación
Log
7Comando gladder
8Análisis con variables numéricas
Análisis Paramétrico No paramétrico
Describir un grupo ?, ?2 Mediana, rango intercuartil
Comparar un grupo a un valor T Student de una muestra Prueba Wilcoxon
Comparar medias en 2 grupos T Student de dos muestras Mann-Whitney
Comparar medias en 2 grupos apareados T Student apareada Prueba Wilcoxon
Comparar medias en 3 o mas grupos ANOVA Kruskal-Wallis
Correlación entre dos variables Pearson (lineal) Spearman (monotónica)
9Comparación de una muestra contra una constante
- Se piensa que la edad de inicio del consumo de
cigarrillos es la adolescencia - Puntualmente se plantea que el consumo se inicia
a los 15 años - Si la distribución es sesgada o la muestra es
pequeña, una prueba paramétrica sobre la media
puede ser poco relevante
10histogram p59, fraction
11Prueba T Student de una muestra
12Aunque no es necesario, hagamos la prueba no
paramétrica
13Prueba signrank (Wilcoxon)
- Ho Mediana de la diferencia 0
- p59 15 0 ó p59 0
- Asume una distribución uniforme alrededor de cero
- Compara puntajes esperados con observados
14Comparación entre dos muestras independientes
- Se piensa que la edad de inicio del consumo de
cigarrillos varía entre varones y mujeres - Si la distribución es sesgada, una prueba
paramétrica sobre la media puede ser poco
relevante - Si los tamaños de muestra son pequeños (n lt 30),
el TLC no se cumplirá y la prueba T podría llevar
a conclusiones erróneas
15- Prueba T Student (paramétrica)
- Ho ?varones ? mujeres Ha
?varones ? ? mujeres
16Igualdad de varianzas
- La prueba T de Student de grupos independientes
difiere si las varianzas difieren entre los
grupos, debiendo agregarse la opción unequal - Para evaluar si las varianzas son comparables o
no se utiliza el comando sdtest
17- Prueba de Varianzas (sdtest)
- Ho ?2varones ?2mujeres Ha ?2varones ?
?2mujeres
18T Student con varianzas diferentes
19Prueba de Mann-Whitney
- Equivalente no paramétrico a una prueba de
hipótesis de promedios para dos muestras - Determina si una variable tiene valores mas altos
en una población que en otra. NO COMPARA LOS
PROMEDIOS!!! - Util si el tamaño de muestra es pequeño o la
distribución es demasiado sesgada
20Qué son los puntajes correlativos?
Varones Mujeres
21Prueba de Mann-WhitneyHo Fumarvarones
Fumarmujeres Ha Fumarvarones ?
Fumarmujeres
22Interpretación
- Se están comparando valores o la
distribución, no los promedios - Si en un grupo los puntajes observados son
mayores a los esperados, ese grupo tiene mayores
valores
23Comparación de dos grupos apareados
- Es una sola muestra, en verdad, en la que se han
medido dos valores - Se puede calcular la diferencia entre los valores
y sería una prueba de una sola muestra - Qué comienza primero, alcohol o tabaco?
- Prueba no paramétrica útil si es muestra pequeña
o distribución muy sesgada
24Prueba T Student apareadaHo µfumar
µtomar Ha µfumar ? µtomar
25Prueba signrank (Wilcoxon)
26Análisis de Varianza
Prueba paramétrica para determinar si hay
diferencias en el promedio de una variable
cuantitativa (inicio fumar) entre tres o más
poblaciones (estratos sociales). Supuestos
- Distribución normal en todas las poblaciones (no
es necesario si el tamaño de muestra es grande) - Varianzas comparables entre poblaciones
- Observaciones (muestras) independientes
27Comparación de Varianzas
- Se usa en el ANOVA para determinar si hay
diferencias entre promedios de varias muestras - También se usa ANOVA en el análisis de regresión,
siendo un caso particular del ANOVA - Utiliza la prueba estadística F
28Las hipótesis
- Hipótesis nula, Ho
- X-inicioAlto X-inicioMedio X-inicioBajo
- Hipótesis alternativa, Ha
- Existen diferencias en la edad de inicio de
fumar promedios de al menos dos estratos sociales
29(No Transcript)
30Prueba de Kruskal-Wallis
- Extensión de la prueba de Mann-Whitney a mas de
dos poblaciones - Equivalente no paramétrico del análisis de
varianza - TAMPOCO COMPARA PROMEDIOS determina si una
población tiene valores diferentes (mas altos o
mas bajos) que las otras poblaciones
31Los puntajes correlativos
32En Stata
33Determinando pares diferentes
34Correlación r de Pearson
- Mide el grado de asociación lineal entre dos
variables numéricas - -1 lt r lt 1, r 0 indica independencia
- Se calcula en stata con el comando pwcorr
- Requiere muestras grandes, distribuciones
cruzadas no sesgadas
35Las hipótesis
- Hipótesis nula (Ho)
- rfumar - tomar 0
- Hipótesis alternativa (Ha)
- rfumar - tomar ? 0
36scatter p59 p89
37Resultados
38Correlación de puntajes (Spearman)
- Equivalente no paramétrico a la prueba de
correlación lineal de Pearson. Se aplica cuando
la correlación no es lineal, la muestra es
pequeña o existen valores muy extremos - Determina si dos variables cuantitativa u
cualitativa-ordinal están correlacionadas
positiva (una crece y la otra también) o
negativamente (una crece y la otra disminuye) - Al igual que las pruebas de Mann-Whitney y
Kruskal-Wallis, también utiliza datos por rangos
39Las hipótesis
- Hipótesis nula, Ho
- ?-puntajesfumar - tomar 0
- Hipótesis alternativa, Ha
- ?- puntajesfumar - tomar ? 0
40Resultados
41Que debemos llevar a casa hoy
- Alternativas disponibles cuando no se cumplen las
condiciones para usar pruebas parámetricas - Como aplicar e interpretar las pruebas de
Wilcoxon, Mann-Whitney, Kruskal-Wallis y Spearman - Limitaciones de las pruebas no paramétricas