Por @Alvy — 31 de Marzo de 2008

Cuando preguntamos el mes pasado por pura curiosidad a los lectores habituales acerca de su nivel de inglés Gonzo me escribió para comentame si no creía que era el tipo de cuestión en la gente tendería a exagerar. Efectivamente en algunas encuestas la gente puede dar respuestas exageradas o evasivas, afectando al resultado de forma notable (aunque se garantice su anonimato, simplemente porque no se fíen). Pero, tal y como le comenté, cuando se quiere hacer de forma más fiable existe una forma sencilla de evitar (al menos parcialmente) esos sesgos.

Una de las técnicas se conoce como respuesta aleatorizada y la desarrolló el economista Stanley Leon Warner en 1965. Existe en múltiples variantes, pero la más sencilla, aplicada a un ejemplo simple, sería la siguiente. Supongamos esta preguna simple:

Contesta sinceramente:
¿Alguna vez has sido infiel a tu pareja?

(Sí: 24,5%, No: 75,5%. Número de respuestas: 150)

Estos son datos de una encuesta realizada esta mañana durante un rato (por alguna razón no funciona poner dos códigos de encuesta en la misma página, así que hice una y ahora hago la otra). Esta sería la misma pregunta «aleatorizada»:

(A ver si funciona el «experimento».)

Podría decirse que utilizar el factor aleatorio del lanzamiento de la moneda lleva al entrevistado a un nivel de sinceridad superior: garantiza que los datos agregados de muchas respuestas serán indicativos del total, pero a la vez que las respuestas individuales mantendrán la condidencialidad. El razonamiento es que como el entrevistador no tiene por qué ver el lanzamiento de la moneda, puede suceder que el entrevistado conteste «Sí» bien porque la moneda salió «cara» o bien que la respuesta a la pregunta es realmente «Sí». Como el entrevistador no tiene modo de saberlo, quien contesta a la pregunta lo hace con mayor tranquilidad.

El rango de respuestas en la pregunta realizada de forma normal (primer ejemplo) variaría entre el 0 y 100% para el Sí. En cambio en el segundo ejemplo el rango para el Sí debería estar entre el 50% y 100% (porque la mitad de los resultados serán «Sí» debido al lanzamiento). Para obtener el resultado real basta descontar ese 50% y multiplicar por dos el valor obtenido. Si, por ejemplo, se obtiene un 55%, bastaría quitarle un 50% y multiplicar 5% por dos, de modo que el resultado sería un 10%.

Este método puede emplearse en diversas variantes, con más preguntas, intercambiando preguntas comprometidas por preguntas inocuas o complicándolo de diversas formas, según el tamaño de la muestra o el tipo de cuestiones; también puede usarse para evitar la influencia del entrevistador de modo que no sepa a qué pregunta se respondió. Véase un ejemplo parecido en El Espejo Lúdico (gracias al cual recordé esta técnica) y un par de variantes en Randomized Response.

Actualización: Con unas 150 respuestas los datos de la encuesta «aleatorizada» indican 56% Sí frente a 44% No. Eliminando el 50% aleatorio significa que contestan Sí un 12% frente a un 88% de No. Los datos no encajan con los de la pregunta directa (25% Sí vs 75% No) pero el sesgo parece en sentido contrario… así que da la impresión de que algo no ha funcionando. Más: Con unas 800+ respuestas sale un más sorprendente todavía 49% para el Sí, lo cual indica que realmente esto no funciona, porque o bien la muestra es pequeña, no se está incluyendo bien el factor aleatorio de las monedas (ni siquiera mitad salen cara, según esto) o bien como decía José en un mail esto no tiene en cuenta el famoso factor «la gente hace lo que le da la gana en Internet», como contestar sin lanzar la moneda, rellenar las encuestas al revés y demás. Así que eso es lo que hay, no es gran cosa.

Compartir en Flipboard  Compartir en Facebook  Tuitear