Une solution pour exploiter les données génétiques sans violer la vie privée

Chargement en cours
Le site Ancestry.com contient plus de 10 millions de profils génétiques. Photo le 17 octobre 2018 à Washington
Le site Ancestry.com contient plus de 10 millions de profils génétiques. Photo le 17 octobre 2018 à Washington
1/2
© AFP, Eric BARADAT

AFP, publié le jeudi 18 octobre 2018 à 20h08

Grâce à un échantillon de salive, des millions de gens ont créé leur profil génétique sur des sites internet. Mais ce trésor reste quasiment inaccessible aux chercheurs en génétique, les sites gardant jalousement leurs bases de données, pétrifiés par la peur d'une fuite.

C'est ce problème que Bonnie Berger, professeure de mathématiques au prestigieux Massachusetts Institute of Technology (MIT), et des collègues pensent pouvoir résoudre, avec un nouvel outil de cryptographie.

"Aujourd'hui, nous sommes au point mort dans le partage de toutes ces données génomiques", explique Bonnie Berger à l'AFP. "C'est très difficile pour les chercheurs d'accéder à ces données, qui ne servent à rien d'un point de vue scientifique".

"Personne ne peut y accéder pour, par exemple, trouver des liens entre des variations génétiques et des maladies", dit-elle. "Mais imaginez si on pouvait exploiter les millions de génomes qui attendent là-bas !"

L'idée de base de cet outil cryptographique, décrite jeudi dans la revue Science, concerne les compagnies pharmaceutiques, mais peut selon les chercheurs être étendus aux fiches ADN.

Les laboratoires cherchent constamment des interactions entre des millions de molécules et les dizaines de milliers de protéines du corps humain. Mais ils ne veulent pas que leurs concurrents sachent sur quoi ils travaillent. Souvent, leurs molécules sont brevetées et confidentielles. Donc ils ne partagent pas grand chose.

- Partage confidentiel -

Avec la nouvelle méthode, fondée sur un "réseau neuronal" sécurisé, détaille Bonnie Berger, les labos pourraient mettre en commun leurs données, les découper entre plusieurs serveurs, qui produiraient des résultats fondés sur l'ensemble des données. Aucune entité n'aura accédé aux données initiales, à moins d'une collusion. Les labos pourraient ainsi démultiplier leurs découvertes, sans rien révéler aux concurrents.

"Nous pouvons faire des choses qui n'étaient absolument pas possibles auparavant", ajoute la professeure. Des techniques existent certes pour crypter les données, mais les calculs deviennent trop lourds et impossibles quand les bases dépassent les millions d'éléments, comme dans le cas du génome.

La technique pourrait permettre aux sites comme Ancestry.com (plus de 10 millions de personnes) et 23andMe.com (plus de 5 millions) d'ouvrir leurs données aux chercheurs en toute confidentialité.

Bonnie Berger dit à l'AFP être en contact avec les deux sociétés. "Ancestry a de nombreuses conversations informelles avec scientifiques et chercheurs", a commenté un porte-parole à l'AFP.

Ces sites sont différents d'un autre dans l'actualité, GEDmatch.com, gratuit, et qui est uniquement un outil d'association. Les utilisateurs y téléchargent le fichier texte de leur profil génétique, obtenu ailleurs, et GEDmatch compare la séquence avec celle d'autres utilisateurs afin de lister ceux qui lui sont le plus proches génétiquement, avec un nom et une adresse email.

Alors que sur Ancestry, 23andMe ou MyHeritage, chacun fournit des informations physiques, généalogiques voire médicales. Ce sont ces renseignements que les chercheurs voudraient pouvoir corréler avec certaines mutations génétiques.

Le site 23andMe a fait un pas dans cette direction, avec un partenariat avec le groupe pharmaceutique GSK. Un porte-parole dit aussi à l'AFP que des collaborations scientifiques ont conduit à la publication d'une centaine d'articles de recherche. Mais les chercheurs n'ont accès qu'à un résumé statistique, du type: "30% des hommes de 20-35 ans ont telle maladie et telle mutation génétique en commun".

Et la participation des utilisateurs est sur une base volontaire, ce qui en limite l'étendue.

Le sujet est débattu aux Etats-Unis, où une étude a montré que l'ADN de la moitié de la population était déjà associable à des gens se trouvant dans GEDmatch, et donc potentiellement identifiable après un peu de travail généalogique.

Cette généalogie génétique est précieuse pour la police, qui retrouve ainsi des violeurs, et pour les personnes qui recherchent leurs parents biologiques. Mais que se passerait-il si ces données étaient piratées, ou exploitées pour discriminer par des compagnies d'assurance ou des employeurs?

"Il n'y a pas vraiment de discrimination systémique" aujourd'hui, indique à l'AFP Benjamin Berkman, chercheur en bioéthique aux Instituts nationaux de santé. "Ce qui ne veut pas dire que cela ne peut pas devenir un problème".

Mais, note-t-il, "la confidentialité génétique inquiète beaucoup de gens, ce qui les conduit à refuser de faire des tests génétiques ou de participer à des programmes de recherche". 

Vos réactions doivent respecter nos CGU.