¿Acceso libre a los datos de las investigaciones?


Desde hace años sigo muy de cerca el trabajo de John Hawks, profesor de antropología de la Universidad de Wisconsin—Madison, tanto a través de su artículos científicos, charlas etc. como del curso MOOC “Evolución humana: pasado y futuro” que tuve la suerte de completar hace poco. Este incansable científico escribe uno de los blogs sobre paleoantropología y evolución humana más leídos de internet (puedes verlo aquí) y hace poco publicó una anotación que me ha parecido muy importante.

Mucho se discute (y se discutirá) acerca de la publicación de los resultados de una investigación en revistas de acceso abierto (open access), pero no tanto sobre la posibilidad de que se acceda a los datos brutos en los que se basan los diferentes artículos que se publican.  Es decir, ¿cómo puede cualquier grupo de investigación replicar los resultados de un prometedor trabajo sobre un nuevo medicamento si no se tiene acceso completo a los datos originales? Está claro que hay muchos intereses enfrentados (lucha por subvenciones, patentes, prioridad en la publicación etc.) pero uno de los pilares fundamentales de la ciencia es la necesidad de corroborar y reproducir los resultados de cualquier investigación. Está claro que un acceso público a los datos que se han manejado a la hora de publicar las conclusiones de un estudio facilitaría enormemente el avance del conocimiento.

Pues bien, algo que es importante en el ámbito biomédico, también es muy relevante en el ámbito de la paleoantropología, un tema que se ha tratado en muy pocas ocasiones.

Los restos fósiles que nos hablan de nuestro pasado son objetos preciosos por su valor intrínseco, lo que hace que sus descubridores y quienes tienen el deber de su custodia y conservación, sean reacios a permitir su examen por el resto de la comunidad científica. A veces resulta simplemente imposible acceder a los restos originales y hay que contentarse con estudiar una réplica. No digamos ya, poder acceder a los datos brutos de los cada vez más frecuentes análisis paleogenéticos (aunque hay honrosas excepciones). Aún no han aparecido los restos originales de Orrorin tugenensis que fueron “robados” hace más de un año, sustraídos al parecer por el encargado de su custodia en un museo local de Kenia. A pesar de que hay réplicas, la pérdida es irreparable.

A raíz de un editorial en Nature genetics sobre este particular, el profesor Hawks lanza una reflexión aplicada a la paleoantropología que he querido traducir al castellano para facilitar su lectura. Es algo que debería hacernos reflexionar. (Puedes leer la entrada original aquí. Se ha mantenido el énfasis de la anotación original y añadido los enlaces más relevantes para ampliar la información).

Las revistas [de investigación] genéticas llevan años exigiendo de forma rutinaria que los datos de las secuencias genéticas sean depositados en una base de datos pública en el momento en que se publica un artículo. Estas revistas han ampliado cada vez más la exigencia de tales depósitos para otros tipos de datos, como la expresión génica, la metilación, o los datos de la asociación genotipo-fenotipo. Algunas revistas pretenden que los datos se depositen en el momento de la remisión del artículo, en lugar de su publicación. En principio, una política de este tipo permite a los evaluadores examinar los datos además de los métodos de análisis y los resultados que se exponen en el artículo. En la práctica, esta política da a los editores más influencia para asegurar que los datos realmente terminan siendo depositados, ya que cuando han tomado la decisión de publicar el artículo, la presentación final del conjunto de los datos puede caer en el olvido.

La revista Nature Genetics publicó en un número reciente un comentario editorial, “No hay impacto sin acceso a los datos“. El editorial acompaña un artículo que revisa las principales características del Archivo Europeo Genoma/Fenoma. Los científicos que están investigando el papel de los genes u otros fenotipos en una enfermedad, pueden depositar sus datos en este archivo y controlar el acceso que se hace de los mismos a largo plazo. El editorial plantea varias cuestiones que me han hecho pensar en la forma en la que el acceso a los datos paleoantropológicos está destinado a cambiar en la próxima década.

Apertura y datos biomédicos

La investigación biomédica plantea una tensión inevitable entre el acceso abierto a los datos y la necesidad de privacidad de los sujetos de investigación, muchos de los cuales son los pacientes sometidos a tratamiento para una enfermedad. Los derechos de los pacientes son una razón clara de por qué no debe permitirse el acceso público a los datos para evitar una distribución generalizada de los mismos.

Al mismo tiempo, la comunidad genética ha reconocido desde hace tiempo, tanto por razones prácticas como morales, por qué el intercambio de datos es imprescindible. Desde un punto de vista práctico, el acceso abierto a los datos permite la replicación de los estudios y la extensión de los resultados de un grupo de pacientes o de una población nacional a otras poblaciones. Tal vez lo más importante, los ensayos pequeños carecen del poder estadístico suficiente para encontrar correlaciones significativas, pero si los datos se archivan y se permite el acceso abierto a otros investigadores, pueden combinarse en metaanálisis de mayor escala que pueden servir de prueba para tamaños de efecto pequeños.

El argumento moral para el intercambio de datos reconoce el enorme regalo que hacen los pacientes al permitir que los mismos sean utilizados para la investigación. Además, los recursos de financiación del gobierno y del sector privado se invierten en la investigación. Los científicos deben ser administradores responsables de ambos para lograr el máximo impacto científico que puedan. La reutilización y una difusión más amplia de los datos son una buena práctica científica.

La generosidad de los sujetos de investigación no es ilimitada: la mayoría de los pacientes que participan en la investigación científica no dan su consentimiento para que se publiquen sus datos médicos, su ADN, o los datos epigenéticos. Algunos participarán en la investigación incluso si sus datos son totalmente públicos, como lo demuestra el Proyecto Genoma Personal. Pero la mayoría prefiere que sus datos se mantengan en privado. Se espera que los científicos mantengan la privacidad del paciente, lo que puede dificultar el compartir esos datos. Aunque es posible eliminar los datos de identificación personal de las bases datos, varios estudios han demostrado lo fácil que es usar esas bases de datos para obtener información personal de los participantes en la investigación. Según el editorial de Nature Genetics:

Además de las variantes comunes, a menudo se necesitan los datos genéticos y fenotípicos a nivel individual, o un resumen de las estadísticas de los proyectos de investigación para la replicación, para los metanálisis y otros muchos usos secundarios, como el desarrollo de métodos o para utilizarlos como muestras de control. Sin embargo, estos datos deben ser procesados, archivados y transferidos de manera que se respeten los acuerdos de consentimiento firmados por los sujetos del estudio. Esto significa a menudo que los datos sólo se pueden proporcionar a los investigadores de buena fe y que se utilicen para fines de investigación específicos.

Las comunidades de investigadores han puesto en marcha una serie de soluciones para permitir el intercambio de datos manteniendo la privacidad. Un ejemplo bien conocido es la dbGaP (la base de datos de genotipos y fenotipos) administrada por los Institutos Nacionales de Salud que, por ejemplo, exige a los investigadores que soliciten el acceso y que acepten un código de conducta. Cuando se juzgan a la luz de la seguridad de los datos, las disposiciones de la dbGaP son en realidad muy débiles, porque dependen del cumplimiento de los acuerdos por parte de los investigadores y las instituciones, en lugar de imponer una protección fuerte a través de la criptografía y el acceso segmentado. Pero las directrices se adecúan con el enfoque normativo general de Estados Unidos en relación con los registros médicos.

El Archivo Europeo Genoma/Fenoma tiene básicamente una función similar pero está sometido a un marco normativo diferente que la dbGaP. Al igual que en EE.UU., hay una tensión entre el acceso a los datos y la privacidad de los pacientes, pero lo que complica las cosas es la variedad de reglamentos nacionales sobre datos e investigación biomédica en los países europeos. Dado que muchos proyectos europeos de investigación biomédica son de alcance internacional, hay enormes diferencias burocráticas que rigen las condiciones por las que puede compartirse cualquier conjunto de datos.

Lo interesante del editorial de la revista Nature Genetics es un pasaje en el que la revista va más allá de las bases de datos de EE.UU. y Europa, para tener en cuenta la responsabilidad regulatoria sobre los proyectos locales de investigación en otras partes del mundo.

Aunque reconocemos que estas bases de datos estadounidenses y europeas son adecuadas para la mayoría de la investigación en su campo, las leyes nacionales pueden exigir que se desarrollen bases de datos locales y protocolos de acceso para diferentes comunidades. El verdadero beneficio que se podría obtener de una administración local de los datos sería la fiabilidad, usando el acceso a los datos para reclutar expertos internacionales cualificados para colaborar o trabajar de forma local en los datos. Pero, dado el alcance global de internet y la nube, la fiabilidad se puede obtener por vía electrónica así como en persona, por lo que instamos a los estrategas y legisladores con visión de futuro que tengan en mente estos beneficios en lugar de ser innecesariamente restrictivos.

Algunas ideas: no estoy de acuerdo en que la contratación de expertos internacionales para trabajar a nivel local en los datos sea “el beneficio más positivo” que podría resultar de bases de datos locales. La mayoría de los países querrán desarrollar la capacidad científica local a través de la formación y el aumento de las publicaciones de los investigadores locales. Sería aconsejable que los países desarrollaran áreas locales con ventaja estratégica en las que pudieran liderar en lugar de hacer seguidismo de las colaboraciones internacionales. La variación de la biología humana entre las poblaciones es un área en la que casi todos los países tienen tanto un interés científico local como una importancia global.

La paleoantropología y el acceso a los datos

La paleoantropología tiene en común con la genética humana que muchos de nuestros sujetos de investigación más importantes están fuera de Europa y EE.UU. Los objetos de investigación de la paleoantropología no sólo son partes esenciales del patrimonio de la humanidad, sino también del patrimonio nacional de muchos países de todo el mundo. Las instituciones que tienen asignada la responsabilidad de proteger el patrimonio están preocupadas, con razón, por el hecho de que una colaboración internacional las coloquen en desventaja. El registro fósil de la evolución humana puede ser un recurso estratégico para el desarrollo local, así como el patrimonio biológico de las poblaciones humanas puede ser un recurso estratégico para la obtención de experiencia en investigación biomédica por los investigadores locales.

Leyendo este editorial de Nature Genetics, me pregunto cuánto tiempo pasará antes de que se escriba un editorial similar sobre los homininos fósiles. Este pasaje se me antoja especialmente cargado de implicaciones (el énfasis es añadido):

Consideramos que un descriptor de datos y un código de acceso directo a un conjunto de datos permanente en un repositorio apoyado por una institución es la condición mínima aceptable de acceso a datos compatible con la publicación en una revista de alto impacto, y por lo tanto mantenemos la opinión de que una legislación restrictiva en materia de acceso a los datos colocará inevitablemente a los investigadores locales en una desventaja internacional en relación a la reputación, la publicación y la colaboración. Sin unas disposiciones específicas para que los solicitantes cualificados puedan utilizar los datos para los fines para los que fueron consentidos originalmente, la gestión mezquina de los mismos también socavará la confianza en la investigación.

Los paleoantropólogos deberían estar familiarizados con ver cuestionados sus resultados de investigación en función de si se puede confiar en sus datos. Algunas comunidades fundan sus creencias en torno al escepticismo acerca de los datos fósiles básicos que forman la base de nuestro conocimiento de la evolución humana. Aunque podemos hacer poco para cambiar las mentes de aquellos que no quieren ver las pruebas, podemos hacer mucho para hacer que las pruebas estén más disponibles para aquellos que si lo harían. Claro que no hay un “consentimiento informado” acerca de los datos paleoantropológicos, pero sí hay reflexiones acerca de la protección del patrimonio y de la educación pública, aspectos que abogan en favor de una distribución de los datos originales más amplia.

Pocos paleoantropólogos o instituciones han adoptado las herramientas para una accesibilidad abierta a los datos que mejore la confianza en sus investigaciones. Este es un fracaso estratégico. La replicabilidad, la transparencia de los métodos y los resultados, y el acceso a los materiales originales son bases esenciales de la práctica científica. La paleoantropología no gana nada resistiéndose a una plena integración con la ciencia dominante; de hecho, esta integración es esencial para el futuro de un campo de investigación como el nuestro cada vez más interdisciplinario.

Obviamente, las revistas de “alto impacto” pueden preferir servir de guía al exigir el acceso a los datos—no por una idea altruista de una ciencia de calidad, sino porque la accesibilidad a los datos sirve como defensa frente a la creciente avalancha de artículos retractados y que no pueden reproducirse en la investigación biomédica. Al enfrentarse con hallazgos cuestionados, la revista puede señalar la disponibilidad de los datos y fomentar la replicación y un examen independiente; lo ideal es que esto suceda cada vez con más frecuencia antes de la publicación del artículo en lugar de después.

Hasta ahora, la paleoantropología ha sido una excepción a esta tendencia. Durante mucho tiempo ha quedado claro que las principales revistas de “alto impacto” publican más resultados cuestionables y sensacionalistas que las revistas de campos específicos o de acceso abierto. Aún así, hemos visto muy pocas retractaciones o correcciones, incluso en los casos en que los resultados de un artículo han sido anulados por los estudios de replicación. Por supuesto, cuando no se disponen de los datos de una muestra fósil, y cuando no se permite que investigadores independientes examinen esos fósiles, no hay replicación posible. Por lo tanto, las revistas han tenido libertad para buscar estudios que generen bombo mediático sin afrontar un escrutinio real.

Me he sometido al proceso de revisión en revistas de alto impacto (ScienceNature, y PNAS) muchas veces en mi carrera, incluyendo varios artículos publicados y varios que fueron rechazadas en última instancia. Cuando he publicado sobre genética, los revisores han incluido regularmente comentarios solicitando cierta seguridad de que los datos serán accesibles una vez publicado el artículo. Cuando he enviado un artículo paleoantropológico a estas revistas, ningún revisor pidió accesibilidad a los datos en absoluto. Eso no es un problema del campo de la paleoantropología en general: por ejemplo, cuando he editado y revisado artículos, solicito constantemente (como editor) o pido que se proporcionen los datos. Pero al parecer, ni yo ni nadie como yo revisa artículos para Nature o Science.

Esta situación no es sostenible por las razones exactas que el editorial de Nature Genetics menciona para los datos biomédicos, a saber:

Una legislación restrictiva en materia de acceso a los datos, colocará inevitablemente a los investigadores locales en una desventaja internacional en relación a la reputación, la publicación y la colaboración.

Restringir el acceso a los datos de los fósiles puede proporcionar ventajas para un pequeño círculo de investigadores occidentales, pero perjudica a las instituciones locales que son las custodias de esos restos. Las instituciones con visión de futuro están estableciendo colaboraciones con una amplia variedad de investigadores internacionales en cuestiones de interés mutuo, cimentando la importancia científica de su patrimonio fósil.







Deje un comentario