Title: Estadstica Instructor: Sergio A' Canchola Aguirre
1EstadísticaInstructorSergio A. Canchola
Aguirre
2Qué es estadística?
- Estadística Ciencia que se encarga de
recolectar, describir e interpretar datos. - Estadística descriptiva Recolección,
presentación y descripción de datos obtenidos de
una muestra. - Estadística inferencial Se encarga de sacar
conclusiones (inferencias) respecto a la
población.
3Términos Básicos
- Población Una colección o conjunto de objetos,
individuos o eventos cuyas propiedades se van a
estudiar. - Muestra Un subconjunto representativo de la
población. Variable Una característica de los
miembros de la población.
4- Dato Valor de la variable asociado con un
elemento de la población o muestra. Puede ser un
número, una palabra o un símbolo. - Datos El conjunto de valores de una variable
para cada uno de los elementos de la muestra. - Experimento Una actividad planificada que
resulta en un conjunto de datos. - Parametro Un valor numérico que representa a
todos los datos de la población. - Estadístico Un valor numérico que representa los
datos de una muestra.
5Ejemplo
El Director de la Facultad de Química desea saber
el promedio de edad de sus profesores
6Solución
- La población son todos los miembros de la
facultad. - Una muestra es un subconjunto representativo de
la facultad. - La variable es la edad de los miembros de la
facultad. - Un dato es la edad de un miembro en específico de
la facultad (42 años). - Los datos es el conjunto de todas las edades en
la muestra (35,29,42,64,54,56,63,37,43,55,44,47,46
,44). - El experimento es el método utilizado para
seleccionar la muestra, la forma en que se
determina la edad de cada miembro de la facultad. - El parametro de interés es el promedio de las
edades de todos los miembros de la facultad de la
IUPR-Bayamón. - El estadístico es la edad promedio de los
miembros de la facultad de la muestra
seleccionada.
7- Ejemplo Un estudio reciente examinó los
resultados de las pruebas del Colegio León de
una muestra de estudiantes de sexto grado. -
- La media de los puntajes de matemáticas fue de
462. - La media de los puntajes de español fue de 520.
- 2 de los estudiantes tuvo puntajes mayores de
600 puntos en la prueba de matemáticas - 10 de los estudiantes tuvo puntajes mayores de
600 puntos en la prueba de español.
Esta información representa valores que se
obtienen de la estadística descriptiva. Podemos
preguntarnos, qué harán las autoridades
educativas?
8Ejemplo Un estudio reciente examinó los
resultados de las pruebas del Colegio León de
una muestra de estudiantes de sexto grado.
- El Secretario de Educación determinó que los
valores obtenidos (presentados en la
transparencia anterior) son representativos de
toda la población, es decir, todos los
estudiantes de sexto grado - concluyó que los estudiantes estan deficientes en
matemáticas y - ordenó una investigación para determinar por qué
los estudiantes obtuvieron tan bajo puntaje en
matemáticas (toma de decisiones).
Esta información representa ejemplos de
estadística inferencial.
9Variables
- Una variable cualitativa o de atributo describe
un elemento de la población. Ej el color, la
marca, la ciudad y el nombre. - Una variable cuantitativa o numéricas cuantifica
un elemento de la población. Se pueden hacer
operaciones aritméticas con sus valores. Ej la
edad, los ingresos mensuales, el número de
créditos, los gastos de eduación.
10Variables como cualitativa o cuantitativa?
1. La escuela secundaria de donde se graduó
cada estudiante de la clase.
- 2. La cantidad de gasolina que le ponen sus
carros los próximos 10 clientes de J. J.
Petroleum - 3. La cantidad de agua que consume una familia
mensualmente. - 4. El partido político por el cual votarán los
estudiantes en las próximas elecciones para
gobernador.
5. La cantidad de tiempo a la semana que dedican
los estudiantes de la clase a estudiar
estadística.
6. El color de carro preferido por los
estudiantes dela clase.
11Tipos de Variables(cont.)
- Las variables cuantitativas se pueden clasificar
a su vez en discretas o continuas. - Cuantitativas Discretas solo pueden asumir
ciertos valores y normalmente hay huecos entre
ellos. Son conteos normalmente. - Ejemplo1 cantidad de materias aprobadas.(1, 2,3
......) - Ejemplo2 cantidad de hijos (1, 2, 3,4...)
12Tipos de Variables(cont.)
- Las variables cuantitativas se pueden clasificar
a su vez en discretas or continuas. - Cuantitativas Continuas puede asumir cualquier
valor dentro del rango de medición. Normalmente
se miden magnitudes como ser longitud,
superficie, volumen, peso, tiempo, dinero - Ejemplo 1 Peso al nacer.
- Ejemplo 2 Salario de un empleado
- Ejemplo 3 Tiempo de viaje en ómnibus entre
México y Monterrey
131-12
Escalas de Medición
- Las variables cualitativas pueden ser nominales y
ordinales - Las variables cualitativas pueden ser dicotómicas
(binominales) cuando sólo pueden tomar dos
valores posibles como sí y no, hombre y mujer o - politómicas (multinominales) cuando pueden
adquirir tres o más valores. Dentro de ellas
podemos distinguir
14Las variables cualitativas pueden ser nominales y
ordinales
- Nominal los elementos solo pueden ser
clasificados en categorías pero no se da un orden
o jerarquía - Ejemplo 1 Barrio de residencia de los alumnos .
- Ejemplo 2 Color de ojos
- Ejemplo 3 Simpatizante de un club de futbol
15Las variables cualitativas se miden en escala
nominal uordinal.
- Ordinal los elementos son clasificados en
categorías que tienen un orden o jerarquía, la
diferencia entre valores no se pueden realizar o
no son significativas. - Ejemplo 1 Grado de satisfacción en el uso de un
servicio público . - Ejemplo 2 Más caro
16Identifica lo siguiente en términos del tipo de
dato
- 17 gramos
- 25 segundos
- 3 canastas
- 3 incorrectas y 7 correctas
- tallas de camisas
- 2 helados de vainilla
- kilómetros por litro
- el más encantador
17Escalas de Medición
- Las variables cuantitativas se miden en escala de
intervalo o razón. - Intervalo los elementos son clasificados en
categorías que tienen un orden o jerarquía, la
diferencia entre valores se pueden realizar y son
significativas.La diferencia entre dos valores
consecutivos es de tamaño constante y no existe
el 0 absoluto. - Ejemplo Temperatura en grados Celsius
18Escalas de Medición
- Las variables cuantitativas se miden en escala de
intervalo o razón. - Razon los elementos son clasificados en
categorías que tienen un orden o jerarquía, la
diferencia entre valores se pueden realizar y son
significativas. Existe el 0 absoluto, es decir la
ausencia de la variable medida. - Ejemplo 1 Tiempo de vuelo.
- Ejemplo 2 Ingresos familiares
19Variabilidad
- Siempre hay variabilidad en los datos.
- Una de los objetivos de la estadística es
caracterizar y medir la variabilidad. - En la manofactura, controlar o reducir la
variabilidad en un proceso llamado Control
Estadístico de Procesos.
20 Un empacador de refrescos indica que cada lata
contiene 12 onzas. Cuánto refresco tiene en
realidad cada lata?
- Es poco probable que todas las latas contengan
exactamente 12 onzas. - Existe variabilidad en el. proceso de llenar las
latas. - Algunas latas contienen un poco más de 12 onzas,
otras contienen un poco menos. - En promedio las latas tienen 12 onzas.
- El empacador espera que haya poca variabilidad en
el proceso de tal forma que las latas estén lo
más cerca posible a las 12 onzas de refresco.
21Proceso estadístico
Determinar lo que se quiere saber
Objetivo del análisis Qué necesita saber? Qué
espera encontrarse? Seleccionar muestra Cómo de
obtendrán los datos de la muestra?
Población Estadística Recolección de datos sobre
los cuales se desea reunir información Conclusion
es
Recolectar los datos
Estadística inferencial Determinar lo que
indican sobre la población
Estadísticas de la muestra Gráficas Estadística
descriptiva
Datos recolectados de la población
Análisis de datos
22Qué se quiere saber?
- Es importante tener claro el objetivo del
estudio estadístico antes de empezar. Estas
preguntas ayudan - Cuál es la población?
- Qué se desea saber?
- Cuáles variables se considerarán?
- Son variables cualitativas o cuantitativas?
23Cómo se obtendrán los datos?
- Es importante obtener datos buenos y
representativos - Las inferencias se sacan de los datos.
- Las inferencias serán tan buenas como los datos.
- Para obtener los datos se puede hacer un
experimento, una encuesta o un censo.
24Métodos para obtener datos
- Experimento El investigador controla o modifica
el ambiente y observa el efecto en la variable de
estudio. - Encuesta Los datos se obtienen de una muestra
de la población. No hay modificación de
variables. - Censo Los datos se obtienen de toda la
población. Es poco usado por lo costoso y el
tiempo que consume.
25Muestreo
- El proceso de seleccionar la muestra se llama
muestreo. - Para que la muestra sea representativa y la
información se pueda generalizar a toda la
población la muestra debe ser seleccionada
probabilísticamente. - El marco muestral es la lista de todos los
miembros de la población
26Tipos de muestreo
- Muestreo no probabilístico. Los elementos de la
muestra se seleccionan, por que le conviene al
investigador. Los resultados no se pueden
generalizar a toda la población - Muestreo aleatorio o probabilístico. Los
elementos de la muestra tienen una determinada
probabilidad de ser seleccionados
27Muestreo no Probabilístico (intencional o de
juicio)
- Las tres clases más conocidas de muestreo no
probabilístico son - Muestreo por conveniencia
- Muestreo por juicio de experto
- Muestreo por cuotas
28Muestreo por Conveniencia
- La muestra se selecciona, como el nombre lo
indica, por conveniencia de la persona que
realiza la investigación. - Ejemplos de este tipo de muestreo son
- Pedir voluntarios para probar un producto
- Entrevistar gente para obtener su opinion sobre
algún tema en particular. - Entrevistas en la calle para un canal de TV.
29Muestreo por Conveniencia
- En cualquiera de estos casos los elementos de la
muestra se auto-seleccionan o se seleccionan
porque estan fácilmente disponibles. - En todos estos casos no esta claro de que
población se está obteniendo la muestra. - Las muestras por conveniencia se utilizan en las
primeras etapas de la investigación como base
para generar hipótesis de trabajo.
30Muestreo por Juicio de Experto
- La muestra se selecciona de acuerdo a lo que
algún experto piensa que son los mejores
elementos para responder el objetivo particular
de la investigación. - Ejemplos de este tipo de muestreo son
- Testigos expertos que presentan sus puntos de
vista en un juicio. - Selección de alumnos para una olimpiada de
informática
31Muestreo por Cuotas
- La idea básica es reproducir en la muestra
ciertas características de la población (por
ejemplo género, edad etc.) llenando cuotas para
cada una de esas características. - También denominado "accidental". Se asienta
generalmente sobre la base de un buen
conocimiento de los estratos de la población y/o
de los individuos más "representativos" o
"adecuados" para los fines de la investigación.
Mantiene semejanzas con el muestreo aleatorio
estratificado, pero no tiene el carácter de
aleatoriedad de aquél.
32Muestreo por Cuotas
- En este tipo de muestreo se fijan unas "cuotas"
que consisten en un número de individuos que
reúnen unas determinadas condiciones, por
ejemplo 20 individuos de 25 a 40 años, de sexo
femenino y residentes en León. Una vez
determinada la cuota se eligen los primeros que
se encuentren que cumplan esas características.
Este método se utiliza mucho en las encuestas de
opinión.
33Muestreo Probabilístico
- Los métodos de muestreo probabilísticos son
aquellos en los que todos los individuos tienen
la misma probabilidad de ser elegidos para formar
parte de una muestra y, consiguientemente, todas
las posibles muestras de tamaño n tienen la misma
probabilidad de ser elegidas. - Sólo estos métodos de muestreo probabilísticos
nos aseguran la representatividad de la muestra
extraída y son, por tanto, los más recomendables.
Dentro de los métodos de muestreo probabilísticos
encontramos los siguientes tipos
34Muestreo aleatorio
- Simple
- Sistemático
- Estratificado
- Conglomerado
35Muestreo aleatorio simple (m.a.s.)
- Se eligen individuos de la población de estudio,
de manera que todos tienen la misma probabilidad
de aparecer, hasta alcanzar el tamaño muestral
deseado. - Se puede realizar partiendo de listas de
individuos de la población, y eligiendo
individuos aleatoriamente en una computadora. - En general, las técnicas de inferencia
estadística suponen que la muestra ha sido
elegida usando m.a.s., aunque en realidad se use
alguna de las que veremos a continuación.
36Muestreo Aleatorio Simple
- Población 5000 agricultores de un valle
registrados en un marco muestral. - Muestra 10 agricultores
- Procedimiento Generar 10 números aleatorios
entre 0 y 5000. La función en Excel sería
aleatorio()5000 aleatorios.xls
37Muestreo sistemático
- Se tiene una lista de los individuos de la
población de estudio. Si queremos una muestra de
un tamaño dado, elegimos individuos igualmente
espaciados de la lista, donde el primero ha sido
elegido al azar. - CUIDADO Si en la lista existen periodicidades,
obtendremos una muestra sesgada. - Un caso real Se eligió una de cada cinco casas
para un estudio de salud pública en una ciudad
donde las casas se distribuyen en manzanas de
cinco casas. Salieron con mucha frecuencia las de
las esquinas, que reciben más sol, están mejor
ventiladas,
38Muestreo Sistemático
- Procedimiento
- Conseguir un listado ordenado de los N elementos
de la población (no siempre es necesario). - Determinar el tamaño de muestra n.
- Definir el tamaño del salto sistemático kN/n
- Elegir un número aleatorio, r entre 1 y k
(rarranque aleatorio). - Seleccionar los elementos de la lista r k, r
2k
39Elección de una muestra con salto sistemático
- Población 5000 agricultores del Valle registrados
en el marco muestral - Muestra 10 agricultores
- Procedimiento
- Definir el tamaño del salto sistemático
k5000/10500 - Elegir un número aleatorio, r entre 1 y 500.
Utilizando Excel aleatorio()50095.7 96 - Seleccionar los elementos de la lista 96, 596,
1096, 1596, 2096, 2596, 3096, 3596, 4096, 4596.
40Muestreo estratificado
- Se aplica cuando sabemos que hay ciertos factores
(variables, subpoblaciones o estratos) que pueden
influir en el estudio y queremos asegurarnos de
tener cierta cantidad mínima de individuos de
cada tipo - Hombres y mujeres,
- Jovenes, adultos y ancianos
- Se realiza entonces una m.a.s. de los individuos
de cada uno de los estratos. - Al extrapolar los resultados a la población hay
que tener en cuenta el tamaño relativo del
estrato con respecto al total de la población.
41Muestreo estratificado con asignación proporcional
- Suponga que los 5000 agricultores estan divididos
de la siguiente manera - Valle abajo2500, valle medio1500 y valle
alto1000 - En una muestra de 50 agricultores, seleccionada
desde los 3 estratos con asignación proporcional
daría los siguientes tamaños de muestra - Valle abajo25
- Valle medio15
- Valle alto10
42Muestreo estratificado
- Ejemplo puede ser el estudio de la cantidad de
tiempo que individuos de diferentes categorías de
ingreso dedican a diversas actividades en sus
ratos de ocio, oquizá el porcentaje de dinero que
gastan en sus actividades recreativas, oel tipo
de vacaciones que prefieran.
43Muestreo estratificado
- Ejemplo Supongamos que, en Valencia, 70 de los
niños de primaria van a escuela pública y el 30
a concertada. Si queremos 1,000 niños, lo que
haremos es dividir los alumnos en 2 estratos
(pública y concertada) y se eligen aleatoriamente
700 niños de la pública y aleatoriamente 300 de
la concertada.
44Muestreo por grupos o conglomerados
- Se aplica cuando es difícil tener una lista de
todos los individuos que forman parte de la
población de estudio, pero sin embargo sabemos
que se encuentran agrupados naturalmente en
grupos. - Se realiza eligiendo varios de esos grupos al
azar, y ya elegidos algunos podemos estudiar a
todos los individuos de los grupos elegidos o
bien seguir aplicando dentro de ellos más
muestreos por grupos, por estratos, aleatorios
simples,
45Muestreo por conglomerado
- Se desea obtener una muestra de 600 viviendas de
una ciudad, el muestreo aleatorio simple
implicaría enviar a los encuestadores a 600
lugares distintos de la ciudad. - Un muestreo por conglomerados podría consistir en
seleccionar 10 manzanas de cada zona y por último
seleccionar 3 viviendas de cada manzana.
46Aleatorio simple
Sistemático
Estratificado
Conglomerados