El factor Bayes
Se describen los conceptos de odds y probabilidad, así como su uso combinado junto al factor o regla de Bayes para los cálculos de la probabilidad de estar enfermo o sano tras conocer el resultado de una prueba diagnóstica.
Y tiro porque me lleva la corriente. Seguramente todos conoceréis el juego de la oca. Es un juego de mesa que existía ya a finales del siglo XIX, para entretener a niños y mayores.
Consiste en una serie de 63 casillas, dispuestas en espiral, que hay que recorrer desde el inicio hasta el final, avanzando un número de casillas según la puntuación que se saca al tirar uno o dos dados.
Para animar el juego, hay algunas casillas especiales que te hacen avanzar más rápido o retroceder parte de lo ya avanzado. Entre estas están las dos casillas del puente. Si caes en una de ella, avanzas o retrocedes hasta la otra, al tiempo que entonas aquello de “de puente a puente y tiro porque me lleva la corriente”.
Pensando en esto de ir de un puente a otro, me ha venido a la cabeza el vaivén que podemos hacer en el campo de las probabilidades entre dos conceptos muy utilizados, parecidos aunque diferentes, como son los conceptos de probabilidad y de odds.
Así que, aunque sea mucho menos divertido que el juego de la oca, hoy vamos a hablar de probabilidades y de odds, de cómo pasar de una a otra como si fuésemos de puente a puente, y de su aplicabilidad para calcular la probabilidad de estar enfermo después de hacernos una prueba diagnóstica.
No veis la relación entre todo esto. Seguid leyendo y lo entenderéis.
Unas definiciones previas
En primer lugar conviene diferenciar de forma clara entre probabilidad y odds.
La probabilidad es la posibilidad de que un suceso aleatorio se produzca. Es mejor dar un ejemplo que tratar de explicarlo.
Imaginad que tenemos una población de 100 personas, 20 de las cuales padecen esa terrible enfermedad que es la fildulastrosis. Podemos calcular la probabilidad de tener la enfermedad en esa población. Dicho de otra forma, la probabilidad de que, si elegimos un individuo al azar, este tenga fildulastrosis.
Para ello, siguiendo el enfoque frecuentista clásico, dividimos el número de sucesos favorables (20 enfermos) entre el número total de sucesos posibles (100 personas): P = 20 / 100 = 0,2 = 20%. Podemos concluir, de esta manera, que la probabilidad de padecer fildulastrosis en nuestra población es del 20%.
Como puede verse, la probabilidad es una proporción. Es importante entender que la proporción es un cociente en el que el numerador se encuentra incluido en el denominador: los 20 enfermos del numerador se incluyen entre los 100 individuos del denominador.
La odds, que tiene su origen en los juegos de azar, es una cosa un poco diferente. En este caso, la odds es un cociente entre los individuos que tienen la característica y los que no la tienen. En nuestro ejemplo, se calcularía como 20 enfermos / 80 sanos = 0,25.
Pero no nos confundamos, esto no es un porcentaje, por lo que no podemos decir que la odds es del 25%. La odds no es una proporción, porque el numerador no se incluye en el denominador. Claro que sí podríamos decir que la odds de estar enfermo a no estarlo es de 20:80 o simplificando, de 1:4. Habrá un enfermo por cada 4 sanos en nuestra población.
Así, podemos definir la odds como la probabilidad de que un suceso ocurra dividido por la probabilidad de que no ocurra:
odds = P / (1 – P)
Odds, probabilidad, y viceversa
Ya hemos visto cómo calcular la probabilidad y la odds de que un suceso se produzca. En nuestro ejemplo son muy parecidas pero, como ya vimos en una entrada anterior, si la frecuencia del suceso que estamos estudiando es muy alta, la odds tenderá a sobreestimar la asociación y se separará del valor de la probabilidad.
Pero lo que nos interesa en esta ocasión es ver cómo podemos pasar de una a otra.
Ya vimos la fórmula de la odds. Veamos ahora la fórmula de la probabilidad expresada en función de la odds del suceso:
P = odds / (odds + 1)
Utilizando estas dos fórmulas, podemos pasar de una medida a la otra con facilidad.
Viendo nuestro ejemplo, la probabilidad de tener fildulastrosis es de 0,2 (20%), así que la odds será de 0,2 / (1 – 0,8) = 0,25.
Y al revés, si sabemos que la odds vale 0,25, podemos calcular que la probabilidad será de 0,25 / (1 + 0,25) = 0,2 (20%).
Y con esto ya hemos visto la relación entre odds y probabilidad. Veamos ahora cómo aplicar todo esto para calcular la probabilidad de estar enfermo tras realizar una prueba diagnóstica.
El factor Bayes
Ya hablamos en una entrada anterior del teorema de Bayes, otro hijo de los juegos de azar. Pues bien, a partir del teorema de Bayes puede demostrarse el factor Bayes (también conocido como regla de Bayes), que dice que la odds después de producirse una condición es igual a la odds previa multiplicada por un factor:
Odds posterior = factor Bayes x odds previa
Y aquí viene la relación de estos conceptos con la realización de pruebas diagnósticas y la probabilidad de estar enfermo (o sano) después de tener una prueba diagnóstica positiva (o negativa).
Veamos primero qué es el factor Bayes. Este equivale a la razón de probabilidades de que se produzca (o no) un suceso entre los que tienen el evento (enfermos) y los que no (sanos). Los más aplicados ya se habrán dado cuenta de que esto es el cociente de probabilidad o cociente de verosimilitud de una prueba diagnóstica.
Podemos definir el factor Bayes de la siguiente manera:
Factor Bayes = P(suceso|enfermo) / P(suceso|no enfermo)
Vamos a poner un ejemplo para entenderlo bien. En este caso, el suceso va a ser tener positiva la serología de fildulastrosis, sabiendo que esta prueba tiene una sensibilidad y especificidad del 90% para clasificar los enfermos de fildulastrosis.
El numerador del factor Bayes sería la probabilidad de serología positiva cumpliéndose el hecho de estar enfermo. Si lo pensamos un poco, esto es la probabilidad de dar positivo en la prueba estando enfermo, que no es otra cosa que la sensibilidad.
Por otra parte, el denominador del factor Bayes sería la probabilidad de tener serología positiva estando sano, que no es otra cosa que los falsos positivos, que podemos definir como el complementario de la especificidad.
Así, el factor Bayes quedaría de la siguiente manera:
Factor Bayes = S / (1 – E)
Ahora lo vemos claro: en este caso, el factor Bayes es el cociente de probabilidad positivo.
En nuestro ejemplo, el factor Bayes vale 0,9 / (1-0,9) = 9. Esto es, el cociente de probabilidad positivo de la serología como prueba diagnóstica es de 9, lo que quiere decir que es 9 veces más probable que tenga la serología positiva un enfermo que un sano.
Podemos repetir todo este procedimiento considerando que pasa si la serología es negativa. En este caso:
Factor Bayes = P(no suceso|enfermo) / P(no suceso|no enfermo)
La probabilidad de tener serología negativa (no suceso) en un enfermo es el porcentaje de falsos negativos, que también podemos expresar como el complementario de la sensibilidad (1-S). Por otra parte la probabilidad de tenerla negativa en un sano no es otra cosa que la especificidad. Así, nuestro factor Bayes, en este caso, podría enunciarse como
Factor Bayes = (1 – S) / E
Que, como vemos claramente, es el cociente de probabilidad negativo. En nuestro ejemplo valdría (1 – 0,9) / 0,9 = 0,11. Esto significa, de forma aproximada, que es 9 veces (1/0,11) más probable tener una serología negativa en un sano que en un enfermo.
De todo esto se puede concluir que una prueba diagnóstica potente tendrá un cociente de probabilidad positivo alto y un cociente de probabilidad negativo muy bajo.
De odds a probabilidad, otra vez
Cuando nosotros hacemos una prueba diagnóstica a un paciente, queremos saber qué probabilidad tiene de estar enfermo en función del resultado de la prueba. Sin embargo, las odds que hemos visto hasta ahora no nos ofrecen este dato de forma directa, aunque podemos calcularlo. Veamos cómo.
Nosotros lo que habitualmente conocemos es la probabilidad de estar enfermo antes de hacerse la prueba, que no es otra cosa que la prevalencia de enfermedad en la población de la que procede el sujeto.
En nuestra población de ejemplo de 100 personas ya sabemos que la probabilidad de tener fildulastrosis es de 0,2. Ya podemos decir que la prevalencia o, lo que es lo mismo, la probabilidad preprueba, es de 0,2.
A partir de la probabilidad preprueba, podemos calcular la odds preprueba aplicando la fórmula que ya conocemos: odds pre = 0,2/(1-0,2) = 0,25.
Para calcular la odds posprueba, multiplicamos la odds preprueba por el factor Bayes. Si queremos saber las odds posprueba positiva, multiplicamos por el cociente de probabilidad positivo: 0,25 x 9 = 2,25.
Finalmente, aplicamos la fórmula de conversión que ya conocemos para pasar de odds posprueba a probabilidad posprueba: probabilidad pos = 2,25/(1+2,25) = 0,69. Esto quiere decir que si tomamos a una persona de nuestra población de ejemplo al azar, le hacemos una serología y es positiva, hay un 69% de probabilidad de que padezca la enfermedad.
Lo mismo podemos hacer para el resultado negativo. Multiplicamos la odds preprueba por el cociente de probabilidad negativo y obtenemos la odds posprueba negativa: 0,25 x 0,11 = 0,02.
A partir de esta odds posprueba, calculamos la probabilidad posprueba negativa: 0,02/(1+0,02) = 0,02. Esto quiere decir que si la serología es negativa, la probabilidad de estar enfermo es del 2% (visto de otra forma, la probabilidad de estar sano es del 98%).
El nomograma de Fagan
Todo lo que hemos visto hasta ahora está muy bien. Nos permite calcular lo que realmente nos interesa saber: la probabilidad de estar enfermo (o sano) según el resultado de la prueba diagnóstica.
El problema, ya lo habréis notado, es que el método es un poco engorroso. Es por este motivo por el que se diseñó una herramienta gráfica que nos permite calcular la probabilidad posprueba, a partir de la prevalencia basal y el cociente de probabilidad, sin cálculos matemáticos y de manera sencilla. Esta herramienta es el nomograma de Fagan.
No vamos a comentar ahora cómo se utiliza el nomograma de Fagan para no alargar mucho esta entrada, pero os recomiendo que leáis la entrada previa donde lo tratamos. Veréis lo sencillo y útil que puede resultar para calcular las distintas probabilidades posprueba cuando cambian las poblaciones y su prevalencia basal.
Nos vamos…
Y esto es todo por hoy.
Hemos visto la relación entre dos conceptos similares, pero diferentes, como son odds y probabilidad, y cómo calcular cualquiera de ellos a partir del valor del otro.
Hemos visto también la importancia del factor Bayes, que representa los cocientes de probabilidad de la prueba diagnóstica. Su gran utilidad es que nos permite calcular la probabilidad posprueba en poblaciones con diferentes prevalencias de enfermedad, virtud de la que carecen los valores predictivos positivo y negativo. Pero esa es otra historia…