El valor de la independencia

Datos apareados.

Datos apareados

A la hora de describir y tratar variables aleatorias, debemos considerar si se trata de datos independientes o datos apareados.

Los médicos estamos todo el día midiendo cosas. Es lo que mejor se nos da. Si fuésemos tan capaces para curar a nuestros pacientes como para medir cosas en ellos, la mitad de los médicos estaríamos de más por falta de enfermos. Solo hay una cosa que nos gusta más que medir: prohibir. Nos encanta prohibir a la gente todo aquello que les gusta, con las excusas más variadas. Y ahora que se van aproximando las fiestas de fin de año llega nuestra hora feliz de prohibir a diestro y siniestro: que si el alcohol, que si el turrón, que si las fiestas, que si esto o aquello.

Pero, hasta que llegue el momento, tendremos que conformarnos con medir. Habitualmente medimos variables, que son datos que, como su propio nombre indica, varían de persona a persona. Una vez que hemos medido muchas variables en un grupo de personas tenemos que empezar a trabajar con los datos para poder sacar alguna conclusión de provecho.

Datos apareados

Lo primero que haremos será describir los datos con medidas de tendencia central y medidas de dispersión. Acto seguido aplicaremos pruebas estadísticas diversas para comparar unas variables con otras. Y es aquí donde juega un papel fundamental el concepto de independencia de las variables estudiadas, ya que los procedimientos estadísticos pueden variar enormemente según trabajemos con variables dependientes o variables independientes y, si no lo tenemos en cuenta, podemos cometer graves errores a la hora de hacer cualquier tipo de inferencia estadística.

Unos ejemplos

Dicho de una forma muy sencilla, dos variables son independientes cuando el conocer una de ellas no nos da ninguna información sobre el valor que puede tener la otra. Por el contrario, son dependientes cuando el valor de una puede darnos una idea de cómo va a ser la otra.

Imaginemos dos variables dependientes: el peso y el índice de masa corporal. Si sabemos que un individuo pesa 18 kilos, ya podemos imaginar que su índice de masa corporal va a ser minúsculo (a excepción, claro está, que sea uno de los enanitos del cuento). Al revés, si tiene un índice de 60, ya podremos ir reparando la báscula después de haberle pesado.

Este ejemplo es muy claro, pero no siempre es tan fácil discernir si dos variables son dependientes o independientes. Supongamos que medimos la altura de los alumnos de una clase. La talla de un chico cualquiera no nos dice cómo va a ser la de otra chica cualquiera de la clase, salvo que sean hermanos o algo parecido. Podremos comparar las tallas de ambos sexos considerándolas variables independientes.

Ahora pensad que hacemos un estudio longitudinal de crecimiento con los mismos alumnos. Los valores de la talla de cada uno nos indicarán más o menos como serán sus valores sucesivos, así que no podremos considerar como independientes los pares de valores de cada alumno en particular.

Por último, vamos a plantear un ejemplo algo más complejo. Supongamos que medimos la talla a un grupo de madres y a sus hijos. A primera vista podría considerarse que las medias de tallas en niños y madres son independientes pero, ¿qué pasaría si las madres más bajas tuviesen más hijos que las más altas?. Probablemente la media de talla en los hijos sería diferente a la que obtendríamos si todas tuviesen el mismo número de hijos. Por tanto, debemos considerarlos como datos apareados.

Otro ejemplo no tan evidente de dependencia es la de los estudios hechos por conglomerados. Imaginaos que estudiamos una técnica diagnóstica y la aplicamos en unos hospitales y en otros no para evitar la contaminación dentro del mismo centro. Habría que tener en cuenta esta relación entre centro y técnica utilizada a la hora de realizar conclusiones sobre los resultados obtenidos: son datos apareados.

Nos vamos…

Para finalizar la entrada de hoy, solo advertiros que no debéis confundir el concepto de independencia que hemos explicado con los conceptos de variable dependiente e independiente de los modelos de regresión. En estos casos el término variable dependiente hace referencia a la variable de resultado, mientras que el de independiente se refiere a la variable explicativa. Pero esa es otra historia…

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Información básica sobre protección de datos Ver más

  • Responsable: Manuel Molina Arias.
  • Finalidad:  Moderar los comentarios.
  • Legitimación:  Por consentimiento del interesado.
  • Destinatarios y encargados de tratamiento:  No se ceden o comunican datos a terceros para prestar este servicio. El Titular ha contratado los servicios de alojamiento web a Aleph que actúa como encargado de tratamiento.
  • Derechos: Acceder, rectificar y suprimir los datos.
  • Información Adicional: Puede consultar la información detallada en la Política de Privacidad.

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Esta web utiliza cookies propias y de terceros para su correcto funcionamiento y para fines analíticos. Al hacer clic en el botón Aceptar, aceptas el uso de estas tecnologías y el procesamiento de tus datos para estos propósitos. Antes de aceptar puedes ver Configurar cookies para realizar un consentimiento selectivo.    Más información
Privacidad