Falsas correlaciones

La correlación perfecta, cuando se basa en la experiencia suficiente, es la causalidad en el sentido científico.

Henry E. Niles en Correlation, causation and Wright´s theory of “Path Coefficients”, Genetics, 1922, núm. 7, págs. 259-261.

Todos sabemos que correlación no implica causalidad, ¿no? Cuando nos adentramos en el apasionante mundo de la estadística, decimos que dos variables están correlacionadas (por ejemplo, variable 1= fumar; variable 2= sufrir cáncer) cuando los valores de una de ellas varían sistemáticamente con respecto a los valores de la otra. En nuestro ejemplo, existirá correlación entre las dos variables si al aumentar el número de personas fumadoras, aumenta también el número de personas afectadas por el cáncer.

Pero es muy importante tener en cuenta que, en ciencia, que exista una correlación estadística entre dos variables (o conjunto de datos), no implica por sí mismo que haya una relación de causalidad. Esto es, y volviendo a nuestro ejemplo, el hecho de que al aumentar el número de personas que fuman aumenten los casos de cáncer, no implica —a priori y por sí mismo— que fumar produzca cáncer (hoy en día se ponen unos mensajes en las cajetillas de tabaco tales como «Fumar mata» aunque no tengamos el mismo nivel de evidencia de esta relación de causalidad como el que se exige, por ejemplo, para introducir un medicamento en el mercado).

A continuación os dejo con unas tablas que ha elaborado Tyler Vigen donde correlaciona distintas variables para mostrar gráficamente el tratamiento de diferentes grupos de datos:

Sigue leyendo