Diapositiva 1 - PowerPoint PPT Presentation

About This Presentation
Title:

Diapositiva 1

Description:

AN LISIS E INTERPRETACI N DE RESULTADOS ESTADISTICOS Dr. Carlos Calder n Cabada Lima, Junio 2006 PRUEBAS ESTADISTICAS PARAMETRICAS Prueba t de Student QUE ... – PowerPoint PPT presentation

Number of Views:141
Avg rating:3.0/5.0
Slides: 69
Provided by: dvd2
Category:

less

Transcript and Presenter's Notes

Title: Diapositiva 1


1
DIPLOMADO DE ESPECIALIZACION DE POSTGRADO EN
ASESORIA DE TESIS
ANÁLISIS E INTERPRETACIÓN DE RESULTADOS
ESTADISTICOS
Dr. Carlos Calderón Cabada
Lima, Junio 2006
2
PRUEBAS ESTADISTICAS PARAMETRICAS
  • Prueba t
  • de Student

3
QUE ES LA PRUEBA t ?
  • ES UNA PRUEBA ESTADISTICA PARA EVALUAR SI DOS
    GRUPOS DIFIEREN ENTRE SI DE MANERA SIGNIFICATIVA
    RESPECTO DE SUS MEDIAS.

4
SIMBOLO
  • t

5
SE CALCULA PARA MUESTRAS PEQUEÑAS DE DISTRIBUCION
NORMAL
6
SE CALCULA PARA MUESTRAS GRANDES DE DISTRIBUCION
NORMAL
7
HIPOTESIS A PROBAR
  • Se trata de comparar dos grupos
  • La hipótesis alternativa plantea que los grupos
    difieren significativamente entre si y la
    hipótesis nula propone que los grupos no
    difieren significativamente entre si.

8
VARIABLE INVOLUCRADA
  • LA COMPARACION SE REALIZA SOBRE LA VARIABLE
    INDEPENDIENTE, SI EXISTEN OTRAS SE DEBE EFECTUAR
    VARIAS PRUEBAS t UNA POR CADA VARIABLE.
  • EL NIVEL DE MEDICION DE LAS VARIABLES ES EL DE
    INTERVALO O RAZON

9
INTERPRETACION
  • PARA GRUPOS PEQUEÑOS (n lt 30)
  • X la media del grupo.
  • µ la media poblacional
  • S la Desv. Estandar
  • n tamaño de muestra

10
INTERPRETACION
  • Para saber si el valor t es significativo, se
    aplica la formula y se calculan los grados de
    libertad.
  • La prueba t se basa en una distribución
    muestral o poblacional de diferencia de medias
    conocidas como la t de Student,
  • Esta distribución es identificada por los grados
    de libertad, los cuales constituyen el numero de
    maneras como los datos pueden variar libremente.

11
RECOMENDACION
  • Mientras mayor sea el numero de grados de
    libertad la distribución t de Student se
    acerca mas a ser una distribución normal.
  • Si los grados de libertad exceden los 120 la
    Distribución Normal es utilizada como una
    aproximación adecuada de la t de Student.
  • Calculado t y los gl (grados de libertad) SE
    ELIGE el nivel de significancia y se compara el
    valor obtenido con el mostrado en la Tabla

12
Distribución t-Student
Para muestras pequeñas de población normal
PRUEBA t
13
CALCULO DE LOS GRADOS DE LIBERTAD
  • gl (N1 N2) 2
  • N1 y N2 representan al tamaño de cada grupo
    comparado.

14
EVALUACION DE RESULTADOS
  • Si nuestro valor calculado es igual o mayor que
    el de la Tabla, se acepta la hipótesis
    alternativa.
  • Pero si el valor es menor se acepta la hipótesis
    nula.

USO DE LA TABLA..
15
EJERCICIOS
  • Tomar la Tabla t y calcular
  • Media Muestral
  • Media Poblacional
  • a
  • n
  • gl. (t-1)

16
DESCANSO
17
HIPOTESIS A CONTRASTAR
Se definen ? Las hipótesis nula y
alternativa con una distribución de probabilidad
conocida ? Regla de decisión(nivel de
significación a) ? Valor crítico o tabulado
datos de la muestra
Se calcula una medidaasociada a la hipótesis
que se desea docimar
Se comparan los valores calculado con tabulado
se rechaza Ho?
H1
SI
NO
Se extraen conclusiones
18
Utilizar prueba de Z
Si
Se conoce ?
No
Si
Utilizar prueba de Z
Es n 30?
Utilizar prueba de Z
No
Si
Si
Se conoce?
No
Se sabe q la población es normal?
Utilizar prueba de t
Utilizar prueba de Z (por el teorema central
del límite)
Si
No
Se conoce?
No
Utilizar prueba de Z (por el teorema central
del límite)
Si
Utilizar una prueba no paramétrica
Es n 30?
19

Esquema cuando se comprar la diferencia entre dos
medias o proporciones muéstrales
Se acepta la hipótesis nula si el estadístico de
la prueba cae dentro de esta región.
Se rechaza la hipótesis nula
Se rechaza la hipótesis nula
Area A área B y (AB) el nivel deseado de
significancia
Area A
Area B
Valor teórico de la diferencia
Valor critico
Valor critico
20
(No Transcript)
21
(No Transcript)
22
Hipótesis estadística según Número de grupo y
tipo de variable
23
Prueba de Correlación de Rango de SPEARMAN
24
PRUEBA DE CORRELACION DE RANGO DE SPEARMAN
  • El coeficiente de correlación por rango se define
    como
  • Donde
  • N de observaciones, de individuos o
    fenómenos clasificados por rango.
  • di Diferencia en los rangos atribuida a dos
    características diferentes del i-ésimo individuo
    o fenómeno.

La correlación por rangos de Spearman mide la
relación entre dos variables que han sido
clasificadas por orden de menos a mayor (o de
mayor a menor)
25
EJEMPLO
  • Una empresa contrató a 7 técnicos en informática,
    que fueron sometidos a un examen de conocimientos
    básicos. Luego de un año de servicio, se calificó
    su rendimiento en el trabajo. A continuación, se
    muestran los resultados

Técnico Puntuación en el examen Clasificación por rendimiento
J. Manzo 82 4
M. Contreras 73 7
C. Gutarra 60 6
F. Olaechea 80 3
D. Barrientos 67 5
F. Estombelo 94 1
J. Cordova 89 2
26
  • Se utiliza la correlación por rangos de Spearman
    para determinar, si hay relación entre las
    calificaciones del examen y el rendimiento en el
    trabajo

1º Se elabora la clasificación de las
puntuaciones del examen
Técnico Puntuación en el examen Clasificación por el examen (X) Clasificación por rendimiento (Y)
J. Manzo 82 3 4 -1 1
M. Contreras 73 5 7 -2 4
C. Gutarra 60 7 6 1 1
F. Olaechea 80 4 3 1 1
D. Barrientos 67 6 5 1 1
F. Estombelo 94 1 1 0 0
J. Cordova 89 2 2 0 0
27
2º Se calcula del coeficiente de correlación por
rangos de Spearman rs
Un coeficiente de correlación oscila entre -1 y
1 los resultados muestran una fuerte relación
positiva entre las puntuaciones de examen de cada
técnico y su rendimiento en le trabajo
28
Contrastando la hipotes
H0 ?s 0, no hay relación entre las dos
variables H1 ?s ? 0, hay relación entre las dos
variables
Tabla N, con a0.10, n7 los valores críticos
serían 0.6786
Se acepta
Se Rechaza
Se Rechaza
0.05
0.05
0.857
-0.6786 Valor critico
0.6786 Valor critico
Como rs está fuera de la región de aceptación,
rechazamos la H0. Se concluye, al 90 de
confianza, existe relación entre las puntuaciones
del examen y el orden de rendimiento en el trabajo
29
Intervalo de confianza para la diferencia de
medias
  • b) Si las varianzas ?12 y ?22 son
    desconocidas
  • Para muestras grandes

donde
30
Cambiar de tema
31
ANALISISNOPARAMETRICO
32
CONSIDERACIONES
  • La mayoría no de estos análisis no requiere de
    presupuestos acerca de la forma de la
    Distribución Poblacional.
  • Las Variables no necesariamente deben estar
    medidas en un nivel de intervalo (orden y
    categoría cero no real) o de razón ( el cero es
    real) .
  • Pueden analizarse datos nominales (sin orden ni
    categoría -Sexo) u ordinales (orden de mayor a
    menor- primero, segundo).
  • En todo caso la variables deben ser categóricas.
  • ( en días, meses, años, etc.)

33
METODOS O PRUEBAS NO PARAMETRICAS MAS EMPLEADAS
  • 1) LA Ji CUADRADA CHI-CUADRADA
  • 2) COEFICIENTES DE CORRELACION E INDEPENDNENCIA
    PARA TABULACIONES CRUZADAS.
  • 3) LOS COEFICIENTES DE CORRELACION PARA RANGOS
    ORDENADOS DE SPERMAN Y KENDALL

34
Ji - CUADRADA
  • Es una prueba estadística para evaluar hipótesis
    acerca de la relación entre dos variables.
  • Se simboliza por ?²
  • Prueba hipotesis Correlacionales
  • Variables involucradas dos ( no considera
    relaciones causales)
  • Nivel de medicion de variables Nominal y Ordinal.

35
Ji - CUADRADA
  • La Chi Cuadrada se calcula a traves de una
    Tabla de contingencia o Tabulacion cruzada, que
    constituye una Tabla de dos dimensiones o matriz
    de dos x dos.
  • Cada dimension contiene una variable.
  • Cada variable se subdivide en dos o mas
    categorias.

36
La Prueba Ji-Cuadrado
  • Distribución Ji-Cuadrado
  • Supóngase que se tiene una serie de variables
    aleatorias independientes con distribución normal
    estándar, , entonces la
    variable aleatoria ,
    sigue una distribución Ji-Cuadrado.

37
La Prueba Ji-Cuadrado
FUNCIÓN DE DENSIDAD MEDIA Y VARIANZA.

38
Procedimientos para usar el análisis de ji
cuadrada y probar la independencia de dos
variables nominales
Hipótesis nula Las variables son independientes
Se construye o se obtiene una tabla de tabulación
cruzada para las frecuencias reales observadas
(Oij )
Suponiendo que las variables son independientes,
se construye una tabla de tabulación cruzada para
las frecuencias teóricas ( Eij)
Se determina el nivel de significado deseado en
la prueba.
Se determina el valor calculado del estadístico
ji cuadrada
39
USO DE LA TABLA
Tabla 4. Distribución de ji-cuadrado Tabla 4. Distribución de ji-cuadrado Tabla 4. Distribución de ji-cuadrado Tabla 4. Distribución de ji-cuadrado Tabla 4. Distribución de ji-cuadrado Tabla 4. Distribución de ji-cuadrado

  Probabilidad de un valor superior Probabilidad de un valor superior Probabilidad de un valor superior Probabilidad de un valor superior Probabilidad de un valor superior
Grados de libertad 0,1 0,05 0,025 0,01 0,005
1 2,71 3,84 5,02 6,63 7,88
2 4,61 5,99 7,38 9,21 10,60
3 6,25 7,81 9,35 11,34 12,84
4 7,78 9,49 11,14 13,28 14,86
5 9,24 11,07 12,83 15,09 16,75
6 10,64 12,59 14,45 16,81 18,55
7 12,02 14,07 16,01 18,48 20,28
8 13,36 15,51 17,53 20,09 21,95
9 14,68 16,92 19,02 21,67 23,59
10 15,99 18,31 20,48 23,21 25,19
El área sombreada de naranja representa la
probabilidad que se
determinada por , donde
es el valor critico del margen superior de
la tabla, y son los grados de libertad del
margen izquierdo de la tabla.

40
Tabla 4. Distribución de ji-cuadrado Tabla 4. Distribución de ji-cuadrado Tabla 4. Distribución de ji-cuadrado Tabla 4. Distribución de ji-cuadrado Tabla 4. Distribución de ji-cuadrado Tabla 4. Distribución de ji-cuadrado

  Probabilidad de un valor superior Probabilidad de un valor superior Probabilidad de un valor superior Probabilidad de un valor superior Probabilidad de un valor superior
Grados de libertad 0,1 0,05 0,025 0,01 0,005
1 2,71 3,84 5,02 6,63 7,88
2 4,61 5,99 7,38 9,21 10,60
3 6,25 7,81 9,35 11,34 12,84
4 7,78 9,49 11,14 13,28 14,86
5 9,24 11,07 12,83 15,09 16,75
6 10,64 12,59 14,45 16,81 18,55
7 12,02 14,07 16,01 18,48 20,28
8 13,36 15,51 17,53 20,09 21,95
9 14,68 16,92 19,02 21,67 23,59
10 15,99 18,31 20,48 23,21 25,19
Uso de la tabla Ji-Cuadrado

41
EJEMPLO
Martha Revilla, directora de mantenimiento de la
calidad en MEGA, elige 29 bicicletas y halla una
varianza en la distancia entre ejes de 32.7
pulgadas cuadradas. Si la señora Revilla tienen
que garantizar que la variación no supere 27
pulgadas cuadradas indica esto que se cumplen
las normas de producción? (a0.05)
Hipótesis
  • Prueba de una cola a la derecha

42
0.05
41.337
33.91
  • Como X233.91lt41.337 la señora Revilla no
    rechazará la H0 y confiará al 95 en que se
    cumplen las normas de producción

43
Que pasaría, si las instrucciones de la señora
Revilla fueran que la variación se mantuviera
inferior a 27 pulgadas cuadradas?
  • Prueba de una cola a la izquierda

0.05
16.928
33.91
  • X2 33.91, la señora Revilla no rechazará la H0 y
    confiará al 95 en que se cumplen las normas de
    producción

44
La señora Revilla, ahora elabora un intervalo de
confianza del 90 para la varianza de la
distancia entre ejes.
0.90
0.05
0.05
16.928
41.337
0.95
  • Revilla puede confiar al 90 en que la varianza
    de la distancia entre ejes se encuentra entre
    22.15 y 54.09 pulgadas cuadradas

45
Prueba Ji-Cuadrado de Independencia
H0 Las variables X e Y son independientes H1
Existe asociación entre X e Y
Y X Categ. 1 ...... Categ. s Total
Cat. 1 O11 ...... O1s R1
......... ....... ...... ....... .....
Cat. r Or1 ...... Ors Rr
Total C1 ...... Cs n
46
Prueba Ji-Cuadrado de Independencia
  • Estadística

47
Ejemplo de Prueba Ji-Cuadrado de independencia
Para verificar la suposición de que la
fabricación de cierto producto está asociado con
enfermedades respiratorias, a 450 trabajadores de
una empresa que fabrica el producto se evaluó
respecto a la presencia de síntomas de
alteraciones respiratorias y se los clasificó a
su vez de acuerdo al nivel de exposición al
producto. Los resultados se presentan en la tabla
siguiente
Presencia de Síntoma Nivel de Exposición Nivel de Exposición Nivel de Exposición Total
Presencia de Síntoma Alto Medio Bajo Total
Si 175 43 27 245
No 90 60 55 205
Total 265 103 82 450
48
H0 Las alteraciones respiratorias son
independientes de la exposición al
producto.
H1 Las alteraciones respiratorias están
asociadas a la exposición al producto
Frecuencias Esperadas
Por ejemplo
Presencia de Síntoma Nivel de Exposición Nivel de Exposición Nivel de Exposición Total
Presencia de Síntoma Alto Medio Bajo Total
Si 144.3 56.1 44.6 245
No 120.7 46.9 37.4 205
Total 265 103 82 450
49
  • Estadística

50
Que sigue una distribución Ji-cuadrado con
(n-1)(C-1)( 2-1)(3-1)2 grados de libertad
En conclusión, se rechaza la H0 (p lt 0.05), es
decir las alteraciones respiratorias están
asociadas a la exposición al producto
51
Distribución F de Snedecor
  • Si y son variables Ji-cuadrado
    distribuidas en forma independiente con y
    grados de libertad, respectivamente, la variable
  • sigue la distribución F con y grados de
    libertad.

52
Tabla F de Fisher
a0.05 con letra normal. a0.01 con letra negrita
53
Ejemplo de uso de la tabla F de Fisher
54
Ejemplo de Aplicación
  • De dos aulas de 5ª año de secundaria se tomaron
    muestras de tamaños 10 y 15 de las notas
    promedios de alumnos para probar si la dispersión
    de las notas es la misma para las dos aulas. Los
    resultados obtenidos son los siguientes
  • Aula 1 15, 16, 12, 14, 14, 15, 16, 13, 14, 15.
  • Aula 2 12, 14, 15, 16, 16, 17, 15, 16, 18, 14,
    12, 15, 16, 14, 13.

Deseamos probar las hipótesis
55
  • Luego
  • Si , entonces para
    las cuantilas y

Luego concluimos que la dispersión de las notas
entre los alumnos para las dos aulas de 5ª año
son las mismas, pues no se encuentra diferencia
significativa.
56
EJEMPLO
La compañía llantera Good Year del Perú, ha
efectuado un estudio sobre los hábitos de manejo
de varios grupos ocupacionales. En una muestra de
35 profesores universitarios, el número promedio
de kilómetros recorridos al año fue de 14,500 con
una desviación standart de 3,200 km. En una
muestra de 40 dentistas, el kilometraje fue de
13,400, con una desviación standart de 1,950 km.
Se tiene
57
Primero se verificará la condición siguiente ?1
? ?2
Planteamos las Hipótesis
58
Para a0.05
0.95
0.025
0.025
0.515
1.9
2.693
Se rechaza la H0, es decir que ?1 ? ?2
59
Luego, se prueba la hipótesis
Diferencia de las medias muestrales
Valores críticos
Y los valores críticos son -1,220.3 y 1,220.3
60
Se acepta la hipótesis nula
Se Rechaza
Se Rechaza
Área 0.025
Área 0.025
Z -1.96
Z 1.96
-1220.3 Valor critico
1220.3 Valor critico
1050 diferencia observada entre las medias
muestrales.
61
Ejercicio
  • Como la diferencia entre las medias muestrales
    es de 1050 millas y se acepta un margen de error
    de 1220 millas, en consecuencia, no hay
    diferencias significativas entre los dos grupos

62
EJEMPLO
Freddy Lopez, operador de la cadena de
restaurantes Las Tejas, ha hecho una encuesta
entre los clientes en dos ciudades, pues desea
averiguar si les gustaría que en el menú se
incluyeran sandwiches de jamón y queso. De las
500 personas encuestadas en la capital, 200
contestaron afirmativamente, mientras que 150 de
las 300 encuestadas en una ciudad cercana también
contestaron afirmativamente. Freddy quiere saber
si, en un nivel de 0.05 esos resultados son
significativamente diferente.
En resumen
63
Primero se determinará si se cumple lo siguiente
?1 ? ?2
Se tiene
Planteamos las Hipótesis
64
Para a0.05
0.95
0.025
0.025
0.8184
1.228
0.576
Se rechaza la H0, es decir que ?1 ? ?2
65
Luego, se prueba la hipótesis
Diferencia de las proporciones muestrales
Valores críticos
Y los valores críticos son -0.071 y 0.071
66
Se acepta la hipótesis nula
Se rechaza
Se rechaza
Área 0.025
Área 0.025
Z -1.96
Z 1.96
Diferencia observada entre las proporciones
muestrales (0.40-.050) -0.10
-0.071 Valor critico
0.071 Valor critico
67
Ejercicio
  • Como la diferencia entre las proporciones
    muestrales es de -0.10 y se acepta un margen de
    error de 0.071, en consecuencia, si hay
    diferencias significativas entre los dos grupos

68
FIN
  • MUCHAS GRACIAS
Write a Comment
User Comments (0)
About PowerShow.com