Estratificación.
La estratificación es una de las técnicas para estudiar el efecto de variables de confusión y modificadoras de efecto sobre las medidas de riesgo.
¿Quién no ha escuchado esta frase un montón de veces?. Es bastante famosa y, aunque parezca curioso, no se conoce bien su origen. Hay quien dice que fue una ocurrencia de Julio César, pero parece que no hay prueba escrita que lo demuestre. Otros dicen que fue una inspiración de Maquiavelo, muy dado a hacer faenas al prójimo con tal de obtener beneficio propio.
Yo creo que lo más probable es que el premio no sea para ninguno de los dos y que la frase en cuestión sea una más del vasto acervo cultural de nuestra mal llamada Humanidad. De lo que no cabe duda, sin embargo, es de que constituye el núcleo de una útil estrategia para la solución de problemas de cierta complejidad. Se divide el problema en partes más pequeñas, se resuelven éstas con más facilidad y se utilizan estas soluciones para construir la solución compleja del problema inicial.
Factor de confusión
¿Recordáis el estudio sobre tabaco y enfermedad coronaria de cuando hablamos de factores de confusión?. Llegamos a demostrar que el efecto de la variable confusora nos enmascaraba el verdadero efecto del tabaco sobre la enfermedad. Pues bien, vamos a dividir para poder vencer.
Para ello vamos a emplear una de las técnicas que existen para estimar el efecto de la variable confusora: la estratificación. Esto consiste en crear subgrupos a partir de la muestra inicial, de forma que cada subgrupo se vea libre de la confusión producida por el factor. Una vez hecho esto, podremos estimar por separado las medidas de asociación y, en caso de que no sean iguales (por efecto de la variable confusora), calcular la estimación de asociación ajustada por el factor por el que hemos estratificado (el de confusión).
Cuando la variable confusora no es continua (por ejemplo, hombre y mujer) lo tenemos fácil para estratificar. Sin embargo, si el factor de confusión es una variable continua, como la edad, puede ser complicado decidir cuántos estratos necesitamos. Por una parte, cuánto más estratifiquemos menos confusión tendremos, pero será más difícil obtener información útil de estratos más pequeños. Y al revés, si hay pocos estratos corremos el riesgo de no ajustar bien la estimación de la medida de asociación.
Estratificación
Yo, como soy bastante chapuza y no quiero hacer muchos números, os voy a poner el ejemplo estratificando en dos grupos por edad: mayores y menores de 50 años.Veis que los riesgos relativos (RR) son diferentes, lo que indica que, probablemente, la edad actúa como variable confusora. Una de las formas para separar el efecto de la edad y obtener una estimación de la asociación del efecto exclusivo del tabaco sobre la enfermedad coronaria es calcular una media ponderada del RR mediante el método de Mantel-Haenszel.
Este método pondera de forma combinada los tres factores de la tabla de contingencia que reflejan la información sobre efecto y exposición: la frecuencia del efecto entre expuestos y no expuestos, los tamaños relativos de los grupos de comparación y el tamaño global de cada estrato. Como es natural, estos dos señores explican esto con un formulón de no te menees, que me vais a perdonar que no ponga aquí. Simplemente, vamos a ver cómo se calcula el nuevo RR ajustado.
Para calcular el riesgo ponderado de los expuestos, en lugar de dividir el número de expuestos enfermos entre el total de expuestos como haríamos normalmente (166/591, para menores de 50 años), lo dividimos por el total del estrato y lo multiplicamos por el total de no expuestos, de la siguiente manera:
- Menores de 50 años: Re = 166 x (605/1196) = 83,97.
- Mayores de 50 años: Re = 227 x (634/1021) = 140,95.
De manera similar, calculamos los riesgos ponderados para los no expuestos multiplicando los no expuestos enfermos por el total de expuestos y lo dividimos por el total del estrato:
- Menores de 50 años: Ro = 68 x (591/1196) = 33,60.
- Mayores de 50 años: Ro = 314 x (387/1021) = 119,01.
Por último, sumamos los riesgos ponderados de los expuestos y lo dividimos entre la suma de los riesgos ponderados de los no expuestos, obteniendo el RR ajustado:
RRa = (83,97+140,95) / (33,60+119,01) = 1,47.
Lo que quiere decir que el riesgo de desarrollar enfermedad coronaria es, aproximadamente, un 50% mayor si se fuma, con independencia de la edad.
Este cálculo tan sencillo se hace bastante más antipático si no somos tan chapuzas y dividimos la muestra en un número mayor de estratos. Y no os digo nada si las tablas de contingencia se complican. Claro que para eso están los ordenadores, los programas de estadística y la calculadoras, que hacen todo esto en un periquete, no sabemos si sin esfuerzo pero, desde luego, sin protestar.
Nos vamos…
De todas formas, hay otros métodos para calcular la estimación de la asociación ajustada. El método que está más de moda en la actualidad es el de la regresión logística. Con los ordenadores que tiene cualquiera hoy en día, un trabajo que no analiza este problema aplicando un modelo de regresión se suele mirar con malos ojos. Pero esa es otra historia…