Title: Instituto de Investigaciones en Matemticas Aplicadas y en Sistemas
1Instituto de Investigaciones en Matemáticas
Aplicadas y en Sistemas
- Especialidad en
- Estadística Aplicada
- MUESTREO
- Profra. Patricia Romero Mares
- Méndez Castrejón E. Ilana
- Quintana Carrillo Roger Humberto
- 5/dic/2007
2RESPUESTAALEATORIZADA
3RESPUESTA ALEATORIZADAÍNDICE
- ENCUESTAS Y DESEABILIDAD SOCIAL
- ESTRATEGIAS
- DEFINICIÓN DE RA
- SUPUESTOS
- CASOS
4ENCUESTAS Y DESEABILIDAD SOCIAL
- Las encuestas son un procedimiento que emplean
los investigadores para obtener información sobre
una muestra de individuos. - Existen ocasiones que éstas incluyen una o más
preguntas que se refieren a aspectos personales
que pueden considerarse íntimos y hacen que el
entrevistado se sienta en peligro o apenado si la
responden correctamente (Méndez, I et. al2004). - Por ello deben cuidar que sean elaboradas con la
calidad correspondiente. Es decir, para que los
resultados obtenidos sean creíbles, es necesario
cuidar la forma de hacer las preguntas.
5- Por lo tanto, en la búsqueda de respuestas
seguras, los encuestadores se enfrentan a varias
dificultades, las cuales son inherentes a toda
persona encuestada inclinaciones,
actitudes, formas de pensar, comportamientos,
tiempo disponible, desconfianzas y una propensión
a mantener la intimidad. - A partir de lo anterior, el problema típico que
surge consiste en la deseabilidad social, la cual
se define como la tendencia de las personas
encuestadas a responder en función de lo que es
aceptable socialmente, por lo tanto existen
6- Características Sensitivas
- Situaciones en donde los entrevistados sienten
dañada su intimidad al pedir que respondan un
cuestionario. - Preguntas Sensitivas
- Son las preguntas que sirven para captar las
características sensitivas de los entrevistados
las cuales se tienen que manejar con cuidado
debido a la no respuesta o a la respuesta
falseada, contestando lo socialmente deseable.
7Se generan sesgos
- Las poblaciones objetivo y de estudio pueden
diferir en cuanto a las variables que estudiamos,
por ejemplo - El nivel económico en la población de estudio es
mayor que en la objetivo. - Los individuos que se eligen en la calle pueden
ser de mayor edad (mayor frecuencia de jubilados) - Hay otras fuentes de error/sesgo
- No respuesta a encuestas embarazosas
- Consumo de drogas, violencia doméstica, prácticas
poco éticas, - Mentir en las preguntas delicadas,
deseabilidad social.
8- Gran número de investigaciones han
proliferado a lo largo de la historia de la
metodología de encuestas, para asegurarse de la
calidad y veracidad de las respuestas obtenidas
sobre temas íntimos consumo de drogas, de
alcohol, prácticas delictivas o fraudulentas,
preferencias políticas , preferencias religiosas
, prácticas abortivas o hábitos sexuales. - De esta manera, la necesidad del hombre por
hacerse de información que tiene carácter íntimo
o por combatir la no respuesta en los
cuestionarios, lo han conducido a desarrollar
nuevas técnicas en la metodología del muestreo,
entre ellas respuesta aleatorizada.
9Cuándo se utiliza esta técnica?
- Cuando las personas que son entrevistadas, se
niegan a contestar o dan una respuesta falseada a
preguntas sensitivas, que las ponen en aprietos
o les pueden ser dañinas en algún sentido. - Se utiliza para estimar las proporciones de
población sensitiva.
10Cuándo se utiliza?
11- Otro ejemplo sería, robar en una tienda se
tipifica como negativo. Y, al hacer la pregunta - Ha sentido usted en alguna ocasión la tentación
de llevarse algo de una tienda, sin pagarlo? - La respuesta esperada sería un NO, aunque la
experiencia del encuestado sea todo lo contrario.
12En síntesis
- Las estrategias para combatir la resistencia de
las personas a responder con sinceridad cuando
el tema es íntimo o poco confesable, se dividen
en dos tipos - Una basada en la redacción de las preguntas o del
bloque de preguntas en el que se inserta la
cuestión que se quiere medir, la otra - se refiere al procedimiento para recabar la
respuesta, en la cual se encuentra el método de
respuesta aleatorizada.
13Respuesta aleatorizada definición
- La técnica de respuesta aleatorizada es un
método especialmente diseñado para asegurar
privacidad a los entrevistados en el estudio de
temas sensibles, delicados o embarazosos. Se
intenta intenta con ello evitar sesgos de los
entrevistados en ciertas conductas hacia la
respuesta socialmente más deseable. - Es decir, le asegura al entrevistado, que su
respuesta sobre temas sensibles (falsa o
verdadera) no será conocida por el entrevistador,
de ahí el nombre de RA la respuesta se realiza
al azar. Se ha utilizado para analizar temas
desde copiar en los exámenes, insolvencia,
fraudes, haber sido arrestado, conducir bajo los
efectos del alcohol, infidelidad, tener hijos
fuera del matrimonio, prácticas abortivas etc.
14Supuestos de la Técnica de RA
- a) Los eventos son independientes del valor de la
variable verdadera es decir son mutuamente
excluyentes del tipo Aporté todos mis ingresos
en la declaración de ISR del año pasado Mi
color favorito es - b) El número de personas entrevistadas debe ser
grande (ley de los grandes números) - c) Las personas entrevistadas entiendan
perfectamente el procedimiento y lo sigan
correctamente.
15Las técnicas de respuesta aleatorizada
- Reducen la motivación para mentir (o no
responder) a las encuestas. - Y, si digo la verdad?
- Cómo se hace? Pídele que lance una moneda antes
de responder y - Si sale cara que diga la opción comprometido
- (no tiene por qué avergonzarse, la culpa es de la
moneda) - Si sale cruz que diga la verdad
- (no tiene por qué avergonzarse, el encuestador
no sabe si ha salido cara o cruz) - Aunque no podamos saber cuál es la verdad en cada
individuo, podemos hacernos una idea porcentual
sobre la población, viendo en cuánto se alejan - las respuestas del 50
16Ejemplo Ha tomado drogas alguna vez?
Insinseros!
Sin respuesta aleatorizada
100 No
Con respuesta aleatorizada
40 No 60 Sí
17Método 1(Warner 1965)
- Supone una población con cierta característica
sensitiva, lo que se quiere es calcular la
proporción p de los elementos que tienen esa
característica.
18Supuestos del Modelo Warner
- Los entrevistados responden verazmente.
- La pregunta que se debe responder es seleccionada
con probabilidad preasignada, ? ó 1 ?, (0 lt
? lt 1). - La población es susceptible de clasificar en el
conjunto A, los poseedores de la característica
sensitiva, ó Ac, que no tiene la característica. - Los entrevistados forman parte de una muestra
probabilística de tamaño n, seleccionada con
reemplazo. (sin pérdida de generalidad se puede
suponer un censo en cuyo caso el tamaño de
muestra es igual al tamaño de la población n
N).
19Ejemplo
Por un procedimiento aleatorio, se determina si
debe contestar a la primera o a la segunda
pregunta, ambas con opciones de respuesta si o
no de modo que el entrevistador desconoce a qué
cuestión corresponde la respuesta aportada por el
entrevistado. Lanza una moneda y según el
resultado contesta la pregunta correspondiente
- AGUILA
- Has probado algún tipo de droga?
- SI NO
20- El método de Warner propone 2 enunciados y en
ambos la respuesta es SI ó NO - Q1. Tienes la característica sensitiva
- SI NO
- Q2. No tienes la característica sensitiva
- SI NO
- La probabilidad ? de que el individuo conteste Q1
es conocida y 1-? es la probabilidad de que
conteste Q2
21- El mecanismo de aleatorización que originalmente
utilizó Warner es una aguja giratoria en un disco
con dos regiones delimitadas. La aguja apunta con
probabilidad ? a la región A y con 1 - ? a la
región Ac, el entrevistado responde a la pregunta
Qa si la aguja señala la región A, o a la
pregunta Qac si la aguja señala la región Ac, de
esta manera, todo se conjuga para que el
entrevistador sólo anote SI ó NO para cada
entrevistado.
22- En el planteamiento de Warner, la probabilidad de
obtener una respuesta afirmativa responde a la
siguiente fórmula
Donde p(si) representa la probabilidad conocida
de respeustas afirmativas, es decir, el número de
respuestas afirmativas del total de encuestados,
P(A) es la probailidad de que por el método
aleatorio le toque responder a la primera
afirmación, P(B) representa la probabilidad de
que responda a la segunda afirmación, ? y ?-1 son
complementarias y representan la probabilidad de
haber declarado sus impuestos vs. Decir su color
favorito.
23Mientras que la varianza se vería incrementada
por el hecho de introducir aleatoriedad en el
proceso de respuesta y se expresa de la siguiente
manera
24Ejemplosnuméricos y aplicación
25Mendez, I .et al. (2004) proponen el siguiente
ejemplo Supongase que se desea conocer la
proporción de estudiantes de la UNAM que fuman
marihuana. La pregunta sensitiva es fuma usted
mariguana por lo menos una vez a la semana?. La
pregunta inocua es su número de cuenta en la
UNAM es par? Suponga que se usa una probabilidad
igual a 0.7 de seleccionar la pregunta sensitiva,
se cuentan diez canicas o tarjetas, de las cuales
siete son rojas y tres son blancas y se pide al
entrevistado tomar una canica o tarjeta y sin
decir qué color fue, regresarla al conjunto. Se
le pide que responda correctamenet a la pregunta
que aparecio aleatoriamente, sin que el
entrevistador sepa a qué pregunta está
respondiendo, si se tiene un color rojo es la
pregunta sensitiva y si es blanco es la inocua.
Sólo responde si o no. Se registrar el número
de respuestas que son si, sea éste n1, en una
muestra tamaño n.
26Entonces se tiene
También se require estimar n1/n
Se llama P a la proporción de si a la pregunta
sensitiva, en el ejemplo es la proporción de
personas que fuman marihuana. El valor de 0.5 se
sabe que es la proporción de personas con número
de cuenta par.
- Pregunta sensitiva 0.7
- Pregunta inocua 0.3
27Entonces, el estimador buscado es (hay que
despejar p con gorro, posteriormente calcular el
tamaño de muestra)
28Ejemplo numérico (Mendenhall, 1989)
- Se diseña un estudio para estimar la proporción
de personas que dieron información falsa en su
declaración de impuestos, en cierto distrito. Ya
que los entrevistados no admitirán que falsearon
en su declaración, se usa una técnica de
respuesta aleatorizada. - El experimentador prepara un mazo de cartas de
las cuales ¾ son marcadas con F, denotando una
declaración falsa, y ¼ son marcadas con C,
denotando una declaración correcta. Se selecciona
una m.a.s. de n400 personas de una población
grande que contribuye en el distrito. En
entrevistas separadas se le pide a cada uno que
elija una carta de mazo y que responda si
cuando la letra de la carta concuerde al grupo
que pertenece . El experimento original n1120
respuesta si. Estime p la proporción de
contribuyentes en el distrito que han mentido
en su declaración y establezca un límite de
error de estimación.
29(No Transcript)
30(No Transcript)
31Método Warneraplicación
- En 1973 se realizó en Alberta, Canadá una
encuesta de fecundidad. Cuyo objetivo era conocer
el no de abortos ilegales. Para ello, se
seleccionaron 3 muestras independientes de tamaño
(n) 327, 269 y 342 mujeres en edad fértil. Entre
otras preguntas, se formulaba la siguiente - Tuvo un aborto provocado (terapéutico o ilegal)
durante 1972? - Los resultados se analizaron a partir de tres
tipos de encuesta en cada una de las muestras - 1ra. Interrogatorio directo.
- 2da. Respuesta anónima por correo o cuestionario
- 3ra. Respuesta aleatorizada (Monedas, dados,
cartas, pelotas de colores, etc.) -
32Resultados
33Modelos aleatorizados evolución
-
- Modelos Aleatorizados para poblaciones
dicotómicas. Warner (1965) ideó el Modelo
Aleatorizado para la obtención de datos
cualitativos en poblaciones dicotómicas con una
característica íntima, sensitiva o
estigmatizante. El mecanismo de aleatorización
implica la formulación de dos proposiciones - 1) Pertenezco al grupo que posee la
característica íntima. - 2) No pertenezco al grupo que posee la
característica íntima. -
- Modelo Aleatorizado para poblaciones
tricotómicas. Una ampliación del modelo de Warner
fue el realizado por Abul Ela, Greemberg y
Horvitz (1967) quienes lo trasladaron al caso de
poblaciones multicotómicas y particularmente
tricotómicas. Aquí se contesta una de tres
preguntas, a diferencia del caso anterior que era
una de dos.
34- Modelo Aleatorizado con una pregunta inocua.
Simmons (1967) sostenía que la confianza de los
entrevistados se vería incrementada si en vez de
contestar aleatoriamente a una de dos preguntas,
las dos referidas a la característica
estigmatizante (modelo de Warner), lo hicieran
con una de dos preguntas una de las cuales fuese
inocua y totalmente desvinculada de la
característica íntima. Los fundamentos teóricos
fueron elaborados por Greemberg, Abul Ela,
Simmons y Horvitz (1969). - Modelo Aleatorizado con una pregunta inocua,
optimizado. En relación a una consideración sobre
el mecanismo de aleatorización, que los autores
hacen en el Modelo aleatorizado con una pregunta
inocua, Moors (1971) retoma el modelo y lo
optimiza, aplicando la técnica de aleatorización
a la primera muestra y un procedimiento de
interrogación directa en la segunda muestra.
35- Modelo Aleatorizado para la obtención de datos
cuantitativos. Greemberg, Kuebler,Abernathy y
Horvitz (1971) desarrollaron el basamento teórico
del Modelo Aeatorizado para la obtención de datos
cuantitativos. Este modelo conserva las mismas
características que el Modelo Aleatorizado con
una pregunta inocua en cuanto al mecanismo de
aleatorización, pero en este caso la
característica en estudio es susceptible de tomar
valores cuantitativos. - Modelo lineal de respuestas aleatorizadas. Warner
(1971) desarrolló un modelo lineal de respuestas
aleatorizadas y demuestró que todos los modelos
aleatorizados existentes hasta entonces eran
casos particulares del Modelo lineal general.
36- Modelo Aleatorizado con dos preguntas inocuas
alternadas. Es desarrollado por Folsom,
Greemberg, Horvitz y Abernathy (1973). Se utiliza
en el caso en que la poblacional con la
característica inocua es desconocida y por lo
tanto se hace necesaria la extracción de dos
muestras simples al azar independientes y no
superpuestas. En este modelo se utilizan dos
preguntas inocuas en forma alternada, además de
la pregunta referida a la característica íntima
en estudio. - Modelo Aleatorizado de respuesta al Azar. Aaker y
Day 1989). - Modelo Aleatorizado de alternativa forzada.Fox y
Tracy (1986) y Chaudhuri mukerjee (1988). Ellos,
aportaron una variante sobre la técnica de
Warner, a la que denominaron método de
alternativa forzada (basado en el lanzamiento de
dos dados).
37Ventajas y desventajas
- Aumento en la complejidad de la pregunta.
- Dificultad en entender el método de
aleatorización. - Requiere de tamaños de muestra grandes.
- Aumenta la probabilidad de contestar la verdad
que en una pregunta directa. - Mayor índice de respuesta.
38Comentarios finales
- La técnica debe de incorporarse en una parte de
la muestra piloto y el método regular en la otra
parte, a fin de evaluar su comprensión, grado de
aceptación y funcionamiento general en la
población. - En su fase de aplicación es preciso constatar que
cada entrevistado haya comprendido lo que debe
hacer, así como que el método confiere absoluta
privacidad. - Las preguntas tratadas por RA deben aparecer al
final del cuestionario, después de las que se
formulan por vías convencionales y previa
explicación de que se trata de un procedimiento
para cuya aplicación se solicita especial
cooperación.
39Bibliografía
- Basulto, J. (1982)/ El diseño de respuesta
aleatorizada de Warner Un modelo de
superpoblación en http//www.ine.es/revistas/est
aespa/96_3.pdf - Cabañeros, J García, E. y Lozano, L.M. (2003)/
Efecto de la deseabilidad social en preguntas
sobre temas comprometidos, en http//www.udc.es/d
ep/mate/biometria2003/Archivos/ps44.pdf - Lohr, S. (2000)/ Muestreo diseño y análisis
International Thomson Editores - Manzano, V.(2003)/ Respuesta Aleatorizada
primer contacto, en http//www.aloj.us.es/vmanzan
o/pdf/academia/respuestaaleatorizada.pdf - Méndez, I Eslava, G. y P. Romero (2004)/
Conceptos Básicos de Muestreo Monografías Vol
12 No.27. IIMAS, UNAM. - Sáenz, M.L. (2003)/ Respuesta aleatorizada con
pregunta no relacionada, frente a pregunta
directa en entrevista individual y grupal en
http//www.sipie.net/esp/modules/news/article.php?
storyid30
40- Sanchez, J.L. (1985)/ Curso básico intensivo de
muestreo en http//www.eustat.es/prodserv/vol07_c
.html - Sanchez, J.L. (1972)/ El tratamiento de
preguntas de carácter íntimo modelo de respuesta
aleatorizada en http//www.ine.es/revistas/es
taespa/55_1.pdf - Scheaffer,R y W. Mendenhall (1987)/ Elementos de
Muestreo, Grupo Editorial Iberoamérica S.A. de
C.V. - Ruíz, M. (1990)/ Una nota sobre la protección de
la intimidad con respuesta aleatorizada, en
http//dialnet.unirioja.es/servlet/articulo?codigo
2362336 -
- Warner, S., Randomized response a survey
technique for eliminating evasive answer bias.
JASA, March 1965, 63-69. - Warner, S., The linear randomized response
model. JASA, Dec. 1971, 884-888.
41Gracias por su atención!