Recherche et données de santé à l’heure du Big Data


Les hôpitaux universitaires ont toujours contribué à l’amélioration de la santé par la recherche médicale, c’est là une de leurs missions. Aujourd’hui, l’exploitation massive des données de santé pose un certain nombre de questions quant à son devenir et à celui de la sécurité des informations recueillies. Elle conduit aussi à des changements de pratiques difficilement adaptables à l’hôpital, comme l’explique pour Gènéthique le Dr Anne-Laure Boch, neurochirurgien, médecin des Hôpitaux de Paris et docteur en philosophie.

 

Gènéthique : Le consentement de la personne est requis pour toute utilisation des données de santé la concernant dans le cadre de la recherche. Aujourd’hui comment ce consentement est-il recueilli ?

Anne-Laure Boch : Quand les gens viennent dans un hôpital universitaire, ils s’attendent à voir des étudiants, à participer à leur formation et ils espèrent aussi que les médecins feront progresser la médecine en faisant de la recherche. Elle se concrétise en publications tirées de l’observation (clinique, radiologique, biologique…) de séries de malades ou de case report, analyses de la situation de personnes réelles dont les noms sont bien sûr tus (anonymisation des données). C’est ce qu’on appelle les travaux rétrospectifs. Dans ces cas et jusqu’à présent, le recueil du consentement n’est recueilli que de façon implicite. Parfois on recontacte les patients,  pour savoir ce qu’ils sont devenus au long cours, longtemps après qu’ils aient été soignés de la pathologie qu’on étudie. A ce moment-là, ils sont informés qu’une étude est en cours et, dans ce cas particulier, on vérifie de façon explicite qu’ils acceptaient que les informations les concernant soient utilisées.

Un exemple : Un jeune chirurgien de mon service vient d’étudier rétrospectivement toutes les biopsies stéréotaxiques, un acte chirurgical qui consiste à prélever un petit bout de cerveau pour analyser précisément la maladie qui l’affecte. C’est un procédé utile pour avoir des informations concernant les tumeurs, mais aussi pour des maladies assez « bizarres », sans diagnostic précis... Il a repris tous les dossiers depuis 20 ans, sachant que notre service réalise plus de 300 de ces interventions par an. Un énorme travail… Il voulait savoir quelles conclusions en tirer : qu’est-ce qu’on trouve quand on fait des biopsies stéréos tout venant ? Dans quelle mesure aboutit-on à un diagnostic qui n’aurait pas pu être rendu autrement ? Est-ce qu’on arrive toujours à répondre à la question posée ? Est-ce que ça change la prise en charge ultérieure ? Est-ce qu’il y a des complications ? Pour ce faire, il n’a pas fait revenir les malades. Il a simplement regardé leurs dossiers. Certains patients sont morts, on ne leur a pas demandé leur accord. Si les dossiers sont nominatifs, la publication ne l’est évidemment pas. Personne n’a été lésé, et la science a avancé !

Pour les travaux prospectifs, les choses sont différentes. Les gens sont enrôlés dans des protocoles particuliers, qui se déroulent à partir de leur accord explicite. Ils sont évidemment informés précisément de la recherche en cours. Leur consentement est explicitement requis, notamment parce que les traitements proposés, les soins mis en place, vont potentiellement être modifiés par l’étude. C’est tout particulièrement le cas pour les études dites « randomisées », où on tire au sort entre différents traitements pour les comparer entre eux.

 

G : Et que répondent-ils ?

ALB : Pour les travaux rétrospectifs, les gens ne refusent quasiment jamais. Les anciens patients acceptent qu’on travaille à partir de leurs dossiers parce qu’ils savent que les résultats tombent dans le domaine public, parce que ces recherches sont utiles et qu’elles permettent d’améliorer de manière diffuse la qualité du service rendu, et surtout parce que cela n’a rien changé à leur prise en charge personnelle.

Pour les études prospectives, c’est autre chose. Les études randomisées, notamment, posent le problème d’une prise en charge potentiellement différente selon qu’on est dans l’étude ou pas. Et puis, cela revient à insinuer le doute vis-à-vis de ce qu’est « le meilleur traitement ». Engager une étude prospective, c’est bien dire aux gens qu’on ne sait pas exactement ce qui le mieux pour eux. Ce n’est pas toujours facile à accepter.

 

G : Qu’est-ce qui change avec l’arrivée des Big data ?

ALB : Les données de santé deviennent une matière première. Jusqu’ici, on se plaçait plutôt sur des travaux assez confidentiels, à petite échelle, juste à partir des comptes rendus d’hospitalisation, du fichier de malades opérés, etc. La méthode restait artisanale. Subitement, on va passer à une immense échelle, pour des progrès éventuels qui ne tomberont pas dans le domaine public, mais qui vont servir des intérêts privés avec à la clé des brevets, de l’argent à gagner par des compagnies pharmaceutiques ou plus largement commerciales (cf. Du business autour des tests génétiques : 23andMe vend les droits d’un médicament)… Ce qu’on appelle « la valorisation ». Cela pose des problèmes éthiques sérieux, par exemple la question de la privatisation des éventuels profits qui seront réalisés à partir de données publiques.  

Par ailleurs, on veut que les chercheurs établissent des protocoles pour protéger les gens contre des dérives potentielles. C’est légitime… Mais ces pratiques, celles des big data, ne sont pas celles des chercheurs académiques ! Surtout parce qu’ils manquent de la force de frappe des grands groupes industriels. C’est comme si, pour protéger les populations civiles, on imposait à des fantassins des règles qui ont été conçues pour des chars d’assaut, voire des porte-avions nucléaires ! Les lois sont élaborées pour protéger les gens contre l’emprise des big data : des utilisations massives de données personnelles pour faire du commerce avec les produits de santé. Mais nous, médecins hospitaliers, nous ne faisons pas de commerce et nous travaillons à une échelle réduite.

 

G : De quoi parle-t-on quand on parle de données de santé ?

ALB : On parle de choses très diverses. Depuis le petit fichier Excel recensant les malades soignés ou opérés par un praticien isolé, jusqu’aux big data, où la puissance de l’informatique permet d’accumuler des quantités gigantesques de données. Et peut-être, de les transformer en applications susceptibles d’être monnayées. Comme elles impliquent l’utilisation de la puissance informatique, ces recherches ne sont pas accessibles à tout le monde. Leurs capacités de gestion dépassent celles de l’hôpital public.

 

G : La protection des données dans ce cas est un enjeu majeur ?

ALB : Tant que les données restent dans votre ordinateur, elles sont protégées par leur manque d’intérêt même. Un hackeur pourrait bien mettre la main dessus (il n’y a pas de grands efforts de protection sophistiquée), mais cela ne lui ferait à coup sûr pas gagner beaucoup d’argent. Les données sont protégées tout simplement parce qu’elles n’intéressent pas grand monde. Mais si on se met à passer au crible un nombre considérable d’informations, alors elles deviennent potentiellement intéressantes. Vu la quantité et surtout les moyens utilisés, la question de la confidentialité de pathologies, qui pourraient être dévoilées, est cruciale parce qu’elle risque de créer de gros problèmes d’atteinte à la vie privée. De fait, un fichier Excel suffit pour traiter nos statistiques, c’est de l’informatique de base. Parfois, on peut faire appel à des informaticiens qui vont nous aider à faire des analyses de meilleure qualité. Mais ça s’arrête là. Quand on manie d’énormes quantités de données, le système se fragilise et on peut craindre de voir ces immenses fichiers passer entre de « drôles » de mains. Sans compter que, de ces données collectées gracieusement, sortiront probablement des applications commerciales. Les gens auront été utilisés à leur insu pour qu’on leur revende, moyennant finances, les progrès auxquels ils auront contribué sans même le savoir.

 

G : Les exigences législatives vont-elles affecter vos pratiques ?

ALB : La suspicion jetée par les pratiques commerciales nous complique déjà la vie. Tant qu’on raconte l’histoire d’un patient parce qu’elle est intéressante d’un point de vue médical, tant qu’on conserve pour nous ces informations et qu’elles ne sont publiées que de façon anonyme, franchement on ne nuit à personne. Tout change quand on commence à travailler à plus grande échelle avec des laboratoires commerciaux. Or, le législateur ne fait pas la différence entre les deux utilisations de ces données de santé. Les lois qu’il élabore sont en train de tuer la recherche publique qui est pourtant la base de tout progrès médical. On veut protéger les patients contre les abus des grosses organisations qui traitent des méga données grâce à l’informatique qu’on appelle abusivement intelligence artificielle (cf. Intelligence artificielle et médecine, le miroir aux alouettes ?), et c’est légitime. Mais voilà que, ce faisant, on paralyse les unités qui ont de petits moyens. En luttant contre le pouvoir exorbitant des GAFA on bloque malheureusement aussi les institutions de recherche publique. Si la législation se durcit à cause des abus potentiels des grosses structures privées – au passage, elles sont aussi munies de bataillons de juristes pour utiliser au mieux les failles de la loi – les petits, c’est-à-dire nous, privés d’assistance juridique, seront obligés d’arrêter de faire de la recherche publique.

 

 G : Dans l’actualité, on lit qu’un patient qui avait fait un test génétique n’a pas évoqué qu’il était susceptible de développer une maladie grave précise qui, si j’ai bien compris, se déclare toujours, et quand la personne a contacté son assurance…

ALB : Les tests génétiques sont un vrai problème, particulièrement dans des familles où certains membres sont atteints de pathologies héréditaires. Une fois que la personne, pourtant encore saine, a fait le test qui prédit qu’elle sera malade dans l’avenir, elle quitte la catégorie des bien-portants. Et ce, alors qu’elle est encore en parfait santé ! On lui jette à la figure sa maladie à venir. Si la maladie peut être traitée le futur malade peut gagner à ce dépistage, mais si ce n’est pas le cas il doit vivre avec cette menace, pire, cette certitude d’un avenir catastrophique. En plus de l’angoisse, il doit aussi d’affronter le regard des autres s’il révèle ce qui l’attend. Par exemple, un refus d’assurance ou des difficultés professionnelles. Ici, le secret médical est impératif. À titre personnel, je conseille à mes patients de ne jamais déclarer leur pathologie à leur entourage professionnel ou même amical. Par exemple, beaucoup d’épileptiques sous traitement conduisent sans danger particulier ni pour eux, ni pour les autres. Ils ont objectivement beaucoup moins d’accidents que les jeunes gens en pleine santé qui sortent, alcoolisés, de boîte de nuit et font des excès de vitesse ! Ils illustrent l’aphorisme classique : « le plus dangereux, c’est le plus apte ». Pourtant, si leur maladie, par ailleurs contrôlée par le traitement, était révélée, on leur interdirait de prendre le volant, avec toutes les conséquences personnelles et sociales qui vont avec. Même chose avec les pathologies tumorales : un antécédent de tumeur, pourtant guérie, vous barre l’accès à de nombreux postes professionnels… sans parler de l’impossibilité de contracter une assurance pour un prêt immobilier, par exemple ! Alors avec les maladies génétiques, c’est encore plus affreux : on vous met sur la touche avant même que vous soyez malades…

Ainsi, ces connaissances menacent les libertés individuelles des personnes malades. Alors, imaginez si ce genre de données est découvert par des algorithmes informatiques qui passent vos données personnelles au crible !

Autre risque, qui dépasse le problème spécifique de la recherche biomédicale : la prise de contrôle par des hackers de centres de traitement dématérialisé, par exemple un centre de rythmologie. Ces centres s’occupent de la maintenance et du réglage à distance de certains  pacemakers cardiaques.  Imaginez que le listing de leurs patients soit piraté… Un hacker pourrait en profiter. Par exemple, vous pourriez recevoir le SMS suivant : « vous avez 15 minutes pour nous envoyer une rançon avant qu’on désactive votre pacemaker » ! C’est un scénario terrifiant, qui n’est pas de l’ordre de la science-fiction, croyez-moi. Ce n’est pas à proprement parler un problème lié à la recherche mais cela tient au risque induit par la collecte de données personnelles facilement accessibles et manipulables. Nos gros fichiers papier étaient difficiles à récupérer et pénibles à analyser. Les voler était certes possible, mais le coût (en énergie) d’une telle manœuvre dépassait le gain attendu. Cela nous protégeait. Avec l’intelligence artificielle, les données deviennent très faciles à voler en masse, à utiliser pour en faire des choses qu’on a du mal à cerner. Avec beaucoup de fantasmes à la clé...

 

G : Est-ce que le Big Data a déjà montré une efficacité réelle dans la recherche biomédicale ?

ALB : Pas encore, mais ça devrait venir très vite. Le fait de croiser des domaines variés, l’accumulation gigantesque de données, même prises au hasard, tout cela devrait donner des résultats. L’épidémiologie, en particulier, en sera bouleversée.

A noter que l’on s’intéresse non seulement aux données personnelles des malades, mais aussi à celles de toute personne en général. Aujourd’hui, l’épidémiologie balaye le vaste spectre des gens bien portants… qui seront malades un jour ! Et donc des clients potentiels pour les entreprises de biotech ! Les grands malades sont déjà beaucoup « utilisés », au sens « d’étudiés ». Le gisement à haut potentiel se trouve auprès des gens pas trop malades ou pas malades du tout mais qui vieillissent, que ce vieillissement soit normal ou pathologique d’ailleurs. On anticipe leurs « besoins de santé » (en fait de soins, produits ou techniques biomédicales) dans un avenir proche. Dans ce cas, on a besoin de données anthropomorphiques très générales : cholestérolémie, poids, habitudes alimentaires… Ce sont les assurances qui se sont rendu compte que ces indicateurs étaient corrélés au risque cardio-vasculaire, par exemple : Si vous êtes en surpoids et fumeur vous risquez davantage de faire un infarctus du myocarde… On va étendre ce type de remarques à l’ensemble de nos caractéristiques. Les petits bilans, les check up que font faire les médecins généralistes, mais aussi les « traces » de vos habitudes individuelles que vous laissez lors de votre navigation internet, c’est ça qui intéresse énormément les GAFA.

 

G : Quand une personne décède est-ce que ses données sont supprimées ?

ALB : Non, et ce serait dommage. Dans le cas d’une maladie grave, on garde évidemment les données pour faire du rétrospectif pour le travail en biologie. Si, pour protéger les gens contre les dérives, on ne pouvait plus travailler sur les dossiers des personnes décédées, ce serait une perte immense, justement pour les maladies le plus graves. Rappelons que la première recherche médicale digne de ce nom, ce qu’on appelle la méthode anatomo-clinique, est née au début du XIXe siècle grâce à l’étude des cadavres. Dans des hôpitaux publics où étaient soignés les indigents, on faisait des fiches cliniques extrêmement précises, où les symptômes de leur maladie étaient clairement décrits et consignés. Si, malgré les soins prodigués, le patient mourrait, on pratiquait systématiquement une autopsie. Et ainsi, on corrélait la description clinique observée pendant la vie avec ce qu’on découvrait comme lésions des organes à l’intérieur du corps. Un des pionniers de la méthode anatomo-clinique est Xavier Bichat. Quand il est mort, à 30 ans, d’une tuberculose contactée pendant son engagement au service des malades, il avait à son actif plus de 3000 autopsies (à l’époque, réalisées sans gants ni tenue de protection). Aujourd’hui avec la biologie, la radiologie, on n’a pas besoin d’attendre la mort du malade pour voir l’intérieur du corps et faire des corrélations entre les symptômes cliniques et les modifications anatomiques des organes. Mais il est évident qu’il faut garder les données, surtout pour les maladies graves qui se terminent mal.

 

G : Des chercheurs parlent de mettre en place un consentement éclairé express dynamique : on est dans le big data, on est dans du prospectif, dans des protocoles de recherches qui sont mis en place, on récupère ses données et après on peut en faire ce qu’on en veut…

ALB : C’est comme le copyright. Vous connaissez la différence entre le copyright américain et le droit de la propriété intellectuel européen, et notamment français ? Dans le droit de la propriété intellectuelle européen, les auteurs gardent la main sur leurs œuvres. Par exemple, un auteur qui a écrit un livre publié par un éditeur n’est pas dessaisi de ses droits sur son livre au profit de l’éditeur. L’éditeur ne peut pas faire un film sans demander l’avis de l’auteur. En revanche avec le copyright, une maison d’édition peut faire signer un contrat stipulant que l’auteur abandonne tout droit ultérieure sur son œuvre. Par la suite, l’éditeur qui a acheté des droits pourrait décider de faire un film indépendamment de l’auteur, sans même que ce dernier ait un droit de regard sur l’adaptation. C’est intéressant de voir que le droit du copyright est en train de prendre le pas sur le droit européen, notamment français. Au lieu de permettre aux patients de garder la main sur leurs données, on envisage que les personnes puissent les abandonner totalement par contrat, sans possibilité de recours ultérieur.

Mais plus précisément ici, c’est une façon pour les petits chercheurs de faire comme les gros, avec leurs moyens réduits. Les petits chercheurs se sentent dépossédés par rapport aux gros et ils cherchent à rééquilibrer la lutte. Notamment, ils veulent éviter la bureaucratie qui paralyse tout, et se prémunir aussi contre les plaintes futures. Ils ont imaginé de demander aux participants à la recherche biomédicale d’entrer un consentement sur internet pour l’utilisation de certaines données personnelles de santé. C’est un consentement formalisé, avec des protections juridiques associées, et bien sûr un système d’anonymisation automatique performant. Il y aurait aussi un retour des connaissances obtenues grâce à ces recherches accessible à tous. L’ensemble est censé rassurer les gens. Ça pourrait fonctionner. Je ne sais pas cependant si cela suffira face à l’offensive des grands groupes privés.

Recoverable fatal error : Argument 1 passed to xmlsitemap_node_create_link() must be an instance of stdClass, boolean given, called in /home/webs/genethique.org/html/sites/all/modules/contrib/xmlsitemap/xmlsitemap_node/xmlsitemap_node.module on line 28 and defined dans xmlsitemap_node_create_link() (ligne 194 dans /home/webs/genethique.org/html/sites/all/modules/contrib/xmlsitemap/xmlsitemap_node/xmlsitemap_node.module).