Factor de ofuscación.
El factor de ofuscación nos ayuda, cuando realizamos una encuesta, a valorar el sesgo que puede producirse por respuestas falsas.
Hoy me vais a permitir que me ponga un poco guarro. Guarro y asqueroso, en realidad. Y es que últimamente no paro de darle vueltas a una cosa que he observado un montón de veces. Seguro que algunos de vosotros también lo habéis visto.
¿Os habéis fijado la cantidad de conductores (y conductoras, no os creáis) que aprovechan los semáforos en rojo para sacarse los mocos?. Algunos, válgame Dios, hasta se los comen. ¡Qué asco!.
Sin embargo, yo he preguntado a la gente de mí alrededor y nadie reconoce hacerlo, con lo que me intriga por qué tengo tan mala suerte de encontrarme en los semáforos con los más guarros del barrio. Claro que igual lo que ocurre es que a la gente que le pregunto le da vergüenza confesar que también profesa tan malsano hábito.
La verdad es que conocer la verdad plantea un problema enorme. Imaginad que hacemos una encuesta. Me voy a tráfico, consigo un listado telefónico de conductores y empiezo a llamar a la gente para preguntarle: ¿se saca usted los mocos en los semáforos en rojo?.
Sesgos de las encuestas
Toda encuesta se puede ver falseada por cuatro fuentes de error.
El primero es el sesgo de selección por elección errónea de los encuestados. Si llamo solo a los de los barrios finos, la mayoría me contestará que no (no porque no lo haga, sino porque le dará más reparo confesarlo). La segunda fuente de error es el “no contesta”: muchos me colgarían el teléfono sin contestar, dándome recuerdos para mi familia, ya de paso. La tercera es lo que se llama el sesgo de memoria. Esto quiere decir que el encuestado dice que no recuerda la respuesta a lo que le preguntemos. En nuestro ejemplo esto se aplicaría poco. Lo que sí nos encontraríamos con toda probabilidad es nuestra cuarta fuente de error: la mentira.
Esto lo saben bien los de Hacienda, muy acostumbrados a que la gente trate de engañarles. Si os llaman del fisco y os preguntan si alguna vez habéis defraudado, ¿qué contestaréis?.
¿Y podemos hacer algo para librarnos de la mentira?. Pues, salvo hacer las encuestas en persona y aplicar a los encuestados el suero de la verdad, no podemos librarnos de ella del todo, aunque sí podemos minimizarla mucho con un poco de ingenio.
Factor de ofuscación
Vamos a suponer que a mis encuestados telefónicos les planteo el siguiente juego: tiran un dado y si sale uno o dos me contestan que se sacan los mocos aunque sea mentira, pero si sale otro número, me tienen que decir la verdad. En cualquier caso, lo que nunca me dicen es lo que les ha salido en el dado.
De esta manera, el sujeto al que pregunto comprende que no puedo saber si su respuesta es verdad o mentira, con lo que estará menos dispuesto a mentir. Esta protección de la privacidad del encuestado hace que no podamos conocer cada respuesta individual pero, a cambio, sí podemos conocer el comportamiento agregado de la muestra de encuestados, aunque siempre con cierta incertidumbre. ¿Cómo lo hacemos?. Desarrollemos el ejemplo del dado.
Pensemos quien nos contestará “sí”. Por una parte, aquellos que saquen uno o dos con el dado. La probabilidad de esto es p (2/6 en nuestro caso). Si encuesto a n personas, sacarán uno o dos un total de n multiplicado por p personas (esto es la suma de éxitos en una serie aplicando la teoría de probabilidad binomial).
Por otra parte, contestarán “sí” el resto que, además de sacarse los mocos, saque de tres a seis con el dado. El número será n (el total de encuestados) multiplicado por la probabilidad del resultado del dado (1-p, 4/6 en nuestro ejemplo) y multiplicado por la probabilidad de padecer este vicio tan sucio (su prevalencia, Pr, que es lo que queremos conocer).
Así que si sumamos los “sí” obligados más los verdaderos obtenemos la siguiente fórmula, donde m son los que contestan que sí se sacan los mocos:
m = np + n(1-p)Pr
Con lo que podemos despejar Pr usando nuestros vastos conocimientos de álgebra:
Pr = [(m/n)-p] / 1-p
Supongamos que encuestamos a 100 individuos y contestan que sí 62. ¿Cuántos se comen los mocos de verdad?. Si sustituimos los valores en nuestra fórmula (m=62, n=100, p=2/6) obtenemos una cifra de 0,43. Quiere decir que al menos un 43% aprovecha los semáforos en rojo para hacer trabajos de minería. Y la cifra real será seguramente mayor, porque siempre habrá quien mienta a pesar de nuestra ingeniosa argucia.
Esta p es lo que se conoce como factor de ofuscación y podemos jugar con su valor usando monedas, otras combinaciones de dados o lo que sea. Hay que tener cuidado al elegir su valor. Si es muy grande el sujeto se sentirá más confiado para responder sinceramente, pero la imprecisión en el cálculo será mayor. Por otro lado, cuanto más pequeña más miedo tendrá el encuestado de que se le vincule con la respuesta real, por lo que tenderá a mentir como un bellaco. Como siempre, en el medio estará la virtud.
Nos vamos…
Los que no os hayáis ido a vomitar habéis podido ver como nos hemos servido del cálculo de la probabilidad binomial para abordar esta cuestión tan asquerosa. Por cierto, si os fijáis, esto que hemos hecho se parece mucho al cálculo de la prevalencia de una enfermedad en una población a partir de la sensibilidad y especificidad de una prueba diagnóstica. Pero esa es otra historia…