Cómo eliminar respuestas evasivas o exageradas en una encuesta simple

Por @Alvy — 31 de marzo de 2008

Cómo eliminar respuestas evasivas o exageradas

Cuando preguntamos el mes pasado por pura curiosidad a los lectores habituales acerca de su nivel de inglés Gonzo me escribió para comentame si no creía que era el tipo de cuestión en la gente tendería a exagerar. Efectivamente en algunas encuestas la gente puede dar respuestas exageradas o evasivas, afectando al resultado de forma notable (aunque se garantice su anonimato, simplemente porque no se fíen). Pero, tal y como le comenté, cuando se quiere hacer de forma más fiable existe una forma sencilla de evitar (al menos parcialmente) esos sesgos.

Una de las técnicas se conoce como respuesta aleatorizada y la desarrolló el economista Stanley Leon Warner en 1965. Existe en múltiples variantes, pero la más sencilla, aplicada a un ejemplo simple, sería la siguiente. Supongamos esta preguna simple:

Contesta sinceramente:
¿Alguna vez has sido infiel a tu pareja?
(Sí: 24,5%, No: 75,5%. Número de respuestas: 150)

Estos son datos de una encuesta realizada esta mañana durante un rato (por alguna razón no funciona poner dos códigos de encuesta en la misma página, así que hice una y ahora hago la otra). Esta sería la misma pregunta «aleatorizada»:

Lanza una moneda. Si sale cara, marca Sí. Si sale cruz, contesta sinceramente: ¿Alguna vez has sido infiel a tu pareja?

Podría decirse que utilizar el factor aleatorio del lanzamiento de la moneda lleva al entrevistado a un nivel de sinceridad superior: garantiza que los datos agregados de muchas respuestas serán indicativos del total, pero a la vez que las respuestas individuales mantendrán la condidencialidad. El razonamiento es que como el entrevistador no tiene por qué ver el lanzamiento de la moneda, puede suceder que el entrevistado conteste «Sí» bien porque la moneda salió «cara» o bien que la respuesta a la pregunta es realmente «Sí». Como el entrevistador no tiene modo de saberlo, quien contesta a la pregunta lo hace con mayor tranquilidad.

El rango de respuestas en la pregunta realizada de forma normal (primer ejemplo) variaría entre el 0 y 100% para el Sí. En cambio en el segundo ejemplo el rango para el Sí debería estar entre el 50% y 100% (porque la mitad de los resultados serán «Sí» debido al lanzamiento). Para obtener el resultado real basta descontar ese 50% y multiplicar por dos el valor obtenido. Si, por ejemplo, se obtiene un 55%, bastaría quitarle un 50% y multiplicar 5% por dos, de modo que el resultado sería un 10%.

Este método puede emplearse en diversas variantes, con más preguntas, intercambiando preguntas comprometidas por preguntas inocuas o complicándolo de diversas formas, según el tamaño de la muestra o el tipo de cuestiones; también puede usarse para evitar la influencia del entrevistador de modo que no sepa a qué pregunta se respondió. Véase un ejemplo parecido en El Espejo Lúdico (gracias al cual recordé esta técnica) y un par de variantes en Randomized Response.