Title: Muestreo en estudios estad sticos Definiciones: Universo
1Muestreo en estudios estadísticos
- Definiciones
- Universo (U) Conjunto de elementos susceptible
de ser estudiados. - Individuos, aldeas, pueblos, acontecimientos
(nacimientos, fallecimientos, ) - Precisión en la definición
- Unidades muestrales (UM) Elementos que componen
el Universo. - Individuos, aldeas, pueblos, manzanas, hogares,
- Un mismo U puede descomponerse en distintos tipos
de UM.
- Muestra (m) Subconjunto de UE extraídas del U.
. - Los resultados de la muestra se van a
extrapolar (estimación)
Población Diana (N)
Unidades muestrales
Unidades Muestrales seleccionadas
Muestra (n)
2Representatividad en estudios estadísticos
m Imagen reducida pero fiel del U
Características a evaluar
Grupos de estudio sobre-representados
Ponderación en la estimación
3- Muestreo Aleatorio Simple (MAS) (Azar Simple)
- Extraer m de tamaño n donde cada UM tiene la
misma probabilidad de ser extraída. Puede
realizarse con o sin reposición. - Los pasos a seguir son
- Listar todos los elementos
- Calcular el tamaño muestral necesario
- Listado de números aleatorios
- Extraer las unidades muestrales del universo
poblacional. - Ventajas
- Sencillez.
- Se basa en métodos probabilísticos
- Sirve de base para otros métodos más complejos.
- Inconvenientes
- Todas las unidades poblacionales han de ser
listadas. - No unifica las distintas características de los
elementos. - Algún grupo poblacional puede no ser representado
4Muestreo Aleatorio Sistemático (MAST) (Azar
Sistemático) Los pasos a seguir son Listar
todos los elementos Calcular el tamaño muestral
necesario Seleccionar una primera unidad,
calculando N/nCE (coeficiente de Elevación)
Seleccionar el resto de unidades a partir de la
1º sumando el CE correlativamente. Ventajas Las
mismas que en MAS Inconvenientes Una cierta
ordenación puede dar lugar a un sesgo. El CE
puede no ser entero. La sustitución de las
unidades vacías produce otro CE y este a su vez
puede producir un nuevo sesgo.
5Muestreo Estratificado Se eligen unas
características de la población diana y se
realizan subgrupos de la misma a partir de éstos,
intentando que sea un fiel reflejo del universo
muestral. Estrato Subconjunto de la población
agrupado por una o más características. Ventaja
s Consigue una mayor precisión que el MAS y el
MAST. Se puede obtener información de cada
estrato. Es más beneficioso logística y
administrativamente hablando. Inconvenientes Es
más complejo que el MAS. Es más costoso
económicamente y de recursos utilizados.
6Muestreo Aleatorio Estratificado (MAE) En este
proceso se divide la población en estratos o
subconjuntos disjuntos y exhaustivos para la
posterior extracción de una MAS en cada uno de
ellos, con el objeto de conseguir una
representación de cada uno de ellos. Se debe
conseguir una homogeneidad intra-estrato y
heterogeneidad inter-estrato. Podemos elegir
dos tipos de reparto al realizar los
estratos Simple.- Cada estrato contiene el
mismo número de unidades muestrales.
L nº de estratos Proporcional.- Cada
estrato es proporcional en la muestra a la
proporción que le corresponde en la población
diana.
7Ejemplo de muestreo aleatorio estratificado
N600 n60 Camas/Hospitales Ne Simple Propo
rcional 60/320 gt1000 50 20
5 (50/600)x60 1000-500 200 20
20 (200/600)x60 lt500 350 20
35 (350/600)x60 N600 n60
n60
Simple
Lnº de estratos3
Proporcional
8Muestreo por Conglomerados Se utiliza cuando
no se pueden listar los elementos de la población
diana, entonces definimos unidades más complejas,
que denominamos conglomerados, que reunan en sí
misma un conjunto amplio de unidades
elementales.
Muestreo Polietápico Se realiza en 2 o más
etapas. Los pasos que sigue son Identificar los
conglomerados a estudiar. Seleccionar al azar
los conglomerados. Seleccionar las unidades
muestrals en cada conglomerado.
9Encuesta transversal sobre una muestra de 4000
sujetosrepresentativa de la población general
de España no institucionalizada de 60 y más
años de edad
10Muestreo probabilístico por conglomerados y
polietápico (NHANES)
CC.AA. y tamaño del municipio
Secciones del Censo
Hogares
Individuos
11Formación de los Conglomerados
Distribución proporcional de la muestra
(entrevistas) según CCAA y tamaño de hábitat
Distribución de la población (residentes) gt59
años según CCAA y tamaño de hábitat
Fuente Censo de Población. INE
Datos elaborados a partir del Censo de Población
(INE)
- 1º. Formación de Conglomerados (clusters) por
estratificación de región de residencia (CCAA) y
tamaño de hábitat, seleccionados con probabilidad
proporcional al tamaño. - Tal que obtengamos la distribución de las
encuestas a realizar en cada cluster, respetando
las proporciones que representan en - el conjunto nacional muestra representativa
proporcional. - La muestra es proporcional y representativa de la
población gt59 años residente en hogares en
España.
12Selección de las Secciones Censales
-Zona geográfica delimitada, dentro de un
municipio -El callejero de la SC delimita su
mapa -Numeración de cada vía Específica
(C/Pez nº50 al nº70) 0001-9999 (todos los nºs
impares de esa calle constan en la CS) 0002-9998
(todos los nºs pares de esa calle están
incluidos en la CS)
- 2º. Selección de Secciones Censales
(callejero) para cada conglomerado, según su
tamaño proporcional - 280 SC (4000Q/14-15Q per SC)
13Selección de los hogares, viviendas o domicilios
Cadencia 6
- 3º. Selección de los Hogares (domicilios) en
las listas de las SC - 15H/SC (10 H titulares y 5 H sustitutos) por rta
esperada de la muestra - Se parte del individuo selección de sujetos gt59
años residentes en cada SC
Sustitución por causa justificada (local no
dedicado a vivienda, deshabitada, rechazo,
ausencia prolongada...) sustitución por vivienda
contigüa
Pto de partida (selección dentro de la SC)
No entrevista, o tomar composición de sexo y
edad del hogar
Academia
Cadencia 8
Deshabitada
Pto de partida (negativa)
14Selección del individuo entre residentes en el
hogar
-Tabla de números aleatorios (a la
dcha) -Preguntar sexo y edad de todos los
miembros de interés (gt59 años) -Ordenar de mayor
a menor edad -Usar la Tabla de números
aleatorios para seleccionar un solo
miembro -Cruzar nº de censados en el hogar (a la
izda) con nº de orden de la entrevista (nº hogar
en la SC)
gt59
1
70
65
2
- 4º. Selección de los Sujetos por sexo y edad,
en los hogares (si gt1 sujeto gt59a en H) - 1 S/H, por el método de Kish
2
Nº ancianos en el H
Supuesto de 10 H/SC
15Ejemplo Para realizar un estudio epidemiológico,
se desea diseñar una muestra estratificada en
función de tres factores de riesgo. Siendo la
población total de 1.000.000 de
habitantes Hábitat Rural-300.000
h. Urbana-700.000 h. Sexo En el medio rural
el de varones es del 40 y en el urbano de
55. Edad Se estratifica en 3 categorías,
siendo su distribución igual en varones que en
mujeres y en cada uno de los hábitat lt20
años-30 20-50 años-50 gt50 años-20. El
grupo con menor muestra debe tener un mínimo de
48 individuos. Diseñar el árbol de
estratificación y el valor mínimo de muestra
necesario.
16Población (1.000.000)
0,7
0,3
Rural (700.000)
Urbano (300.000)
0,4 (0,12)
0,6 (0,18)
0,55 (0,385)
0,45 (0,315)
120.000
180.000
385.000
315.000
Hombres
Mujeres
Hombres
Mujeres
gt50
lt20
gt50
gt50
lt20
gt50
lt20
lt20
20-50
20-50
20-50
20-50
17Ejercicio 1. Se desea determinar la mortalidad
por cierta cardiopatía en una población de
2.000.000 de habitantes. Para ello diseñamos un
estudio cuyo muestreo será estratificado teniendo
en cuenta diversos factores que nos distribuyen a
la población en Alto y Bajo Riesgo, y sabiendo
que el sexo y la edad influyen en esa
enfermedad. Teniendo en cuenta que en la
Población total, tenemos 200.000 personas en el
grupo definido como de Alto Riesgo, que en este
grupo el porcentaje de varones es del 55
mientras que en el grupo de bajo riesgo es del
50 y que en los varones tenemos un 20 menores
de 10 años, un 60 entre 10 y 50 años y un 20
mayores de 50, mientras que en las mujeres este
porcentaje es de 40, 40 y 20 respectivamente
para cada grupo de edad. Realizar el árbol de
estratificación y el número de muestra necesario
en cada uno de ellos sabiendo que en total
necesitamos 2.000 personas.
180,011 22
0,20
Ejercicio 1.
0,60
0,033 66
Varones
0,55
0,20
0,011 22
Alto Riesgo
0,018 36
0,4
0,45
0,4
0,1
0,018 36
Mujeres
0,2
0,009 18
Muestra (2000)
0,09 180
0,20
0,60
Varones
0,27 540
0,9
0,5
0,20
0,09 180
Bajo Riesgo
0,4
0,18 360
0,5
0,4
Mujeres
0,18 360
0,2
0,09 180