Datos apareados.
A la hora de describir y tratar variables aleatorias, debemos considerar si se trata de datos independientes o datos apareados.
Los médicos estamos todo el día midiendo cosas. Es lo que mejor se nos da. Si fuésemos tan capaces para curar a nuestros pacientes como para medir cosas en ellos, la mitad de los médicos estaríamos de más por falta de enfermos. Solo hay una cosa que nos gusta más que medir: prohibir. Nos encanta prohibir a la gente todo aquello que les gusta, con las excusas más variadas. Y ahora que se van aproximando las fiestas de fin de año llega nuestra hora feliz de prohibir a diestro y siniestro: que si el alcohol, que si el turrón, que si las fiestas, que si esto o aquello.
Pero, hasta que llegue el momento, tendremos que conformarnos con medir. Habitualmente medimos variables, que son datos que, como su propio nombre indica, varían de persona a persona. Una vez que hemos medido muchas variables en un grupo de personas tenemos que empezar a trabajar con los datos para poder sacar alguna conclusión de provecho.
Datos apareados
Lo primero que haremos será describir los datos con medidas de tendencia central y medidas de dispersión. Acto seguido aplicaremos pruebas estadísticas diversas para comparar unas variables con otras. Y es aquí donde juega un papel fundamental el concepto de independencia de las variables estudiadas, ya que los procedimientos estadísticos pueden variar enormemente según trabajemos con variables dependientes o variables independientes y, si no lo tenemos en cuenta, podemos cometer graves errores a la hora de hacer cualquier tipo de inferencia estadística.
Unos ejemplos
Dicho de una forma muy sencilla, dos variables son independientes cuando el conocer una de ellas no nos da ninguna información sobre el valor que puede tener la otra. Por el contrario, son dependientes cuando el valor de una puede darnos una idea de cómo va a ser la otra.
Imaginemos dos variables dependientes: el peso y el índice de masa corporal. Si sabemos que un individuo pesa 18 kilos, ya podemos imaginar que su índice de masa corporal va a ser minúsculo (a excepción, claro está, que sea uno de los enanitos del cuento). Al revés, si tiene un índice de 60, ya podremos ir reparando la báscula después de haberle pesado.
Este ejemplo es muy claro, pero no siempre es tan fácil discernir si dos variables son dependientes o independientes. Supongamos que medimos la altura de los alumnos de una clase. La talla de un chico cualquiera no nos dice cómo va a ser la de otra chica cualquiera de la clase, salvo que sean hermanos o algo parecido. Podremos comparar las tallas de ambos sexos considerándolas variables independientes.
Ahora pensad que hacemos un estudio longitudinal de crecimiento con los mismos alumnos. Los valores de la talla de cada uno nos indicarán más o menos como serán sus valores sucesivos, así que no podremos considerar como independientes los pares de valores de cada alumno en particular.
Por último, vamos a plantear un ejemplo algo más complejo. Supongamos que medimos la talla a un grupo de madres y a sus hijos. A primera vista podría considerarse que las medias de tallas en niños y madres son independientes pero, ¿qué pasaría si las madres más bajas tuviesen más hijos que las más altas?. Probablemente la media de talla en los hijos sería diferente a la que obtendríamos si todas tuviesen el mismo número de hijos. Por tanto, debemos considerarlos como datos apareados.
Otro ejemplo no tan evidente de dependencia es la de los estudios hechos por conglomerados. Imaginaos que estudiamos una técnica diagnóstica y la aplicamos en unos hospitales y en otros no para evitar la contaminación dentro del mismo centro. Habría que tener en cuenta esta relación entre centro y técnica utilizada a la hora de realizar conclusiones sobre los resultados obtenidos: son datos apareados.
Nos vamos…
Para finalizar la entrada de hoy, solo advertiros que no debéis confundir el concepto de independencia que hemos explicado con los conceptos de variable dependiente e independiente de los modelos de regresión. En estos casos el término variable dependiente hace referencia a la variable de resultado, mientras que el de independiente se refiere a la variable explicativa. Pero esa es otra historia…