Title: Prueba de Ji Cuadrada (?2)
1Prueba de Ji Cuadrada (?2)
- Prueba No Paramétrica
- Particularmente útil con datos Nominales
2Preferencia de cerveza
- Supongamos que quiero saber la cerveza de
preferencia en una región Elijo al azar a 150
consumidores y les permito probar las principales
marcas, quedando los resultados así
3MARCA A MARCA B MARCA C TOTAL
45 40 65 150
Hipótesis Nula NO existe diferencia en la
preferencia en la Población por las diversas
marcas de cerveza. Hipótesis Alterna SI existe
diferencia en la preferencia en la Población por
las diversas marcas de cerveza
4Cálculo de (?2obt)
- Tenemos que determinar las frecuencias esperadas
(fe) si se realizara un muestreo aleatorio dentro
de la hipótesis nula, y compararlas con las
frecuencias observadas (fo). - Mientras más se acerque la fe a la fo, MÁS
razonable será la Hipótesis Nula.
5Fórmula de (?2obt)
6Y si la preferencia de cerveza fuera aleatoria?
MARCA A MARCA B MARCA C TOTAL
45(50) 40(50) 65(50) 150(150)
7Evaluación de (?2obt)
- Es necesario compararlo con una distribución
muestral teórica que varía según los grados de
libertad. - Los grados de libertad quedan eterminados por el
número de datos fo que varían libremente. - Los grados de libertad se calculan con k-1, donde
k es igual al número de grupos o categorías.
8- En tablas o en SPSS, sabemos los VALORES CRÍTICOS
para comparar el valor obtenido. Así - Si
- En nuestro experimento, con 2 grados y a0.05, el
valor crítico es de 5.991
9En resumen
- 1) Formar tabla con las categorías y las
frecuencias obtenidas - 2) Determinar cómo sería la tabla si las
frecuencias hubieran sido al azar - 3) Calcular (?2obt)
- 4) Determinar grados de libertad (k-1) y alfa,
para buscar el valor crítico de ?2 - 5) Comparar (?2obt) con (?2crit) para descartar o
no la Ho
10Uso de ?2 para probar la independencia entre dos
variables categóricas
- Supongamos que hay una propuesta de ley para
reducir la edad para beber legalmente, de 18 a 16
años. Yo quiero saber si el hecho de ser PANISTA
o PERREDISTA afecta tu actitud al respecto. Hago
un sondeo con miembros registrados de cada
partido, y obtengo los siguientes resultados
11Actitud
A favor Indeciso En contra TOTAL
PAN 68 22 110 200
PRD 92 18 90 200
TOTAL 160 40 200 400
12- Acabo de hacer una TABLA DE CONTINGENCIA que se
compone de dos vías o entradas y muestra la
relación contingente entre dos o más variables,
cuando éstas han sido clasificadas en categorías
mutuamente excluyentes y las entradas de cada
celda son frecuencias.
13Cálculo de (?2obt)
- Aquí, para obtener la fe de cada celda, tenemos
que calcular la proporción estimada de la Ho para
cada columna - En cada una es TOTAL CELDA/TOTAL COLUMNA
- Vg 160/400, 40/400, 200/400
- Ya teniendo las proporciones, para cada celda es
PROPORCION POR TOTAL FILA. - Vg (160/400)(200) 80 (40/400)(200) 20
14Tabla ya con los valores de fe
A favor Indeciso En contra TOTAL
PAN 68(80) 22(20) 110(100) 200
PRD 92(80) 18(20) 90(100) 200
TOTAL 160 40 200 400
15(No Transcript)
16Grados de libertad en tablas de contingencia
- gl (r-1)(c-1)
- Donde
- R es el número de renglones y
- C es el número de columnas
- En nuestro ejemplo, gl(2-1)(3-1)2