L’enjeu des données de vie réelle dans la santé

Les « données de vie réelle » au cœur de l’innovation pharmaceutique



La pratique médicale s’appuie sur le recueil méthodique et l’analyse de données cliniques*. Ces quinze dernières années, la numérisation des dossiers médicaux conjuguée à l’accroissement des capacités de calcul disponibles ont ouvert la voie à l’exploration des données de santé par des algorithmes. Pour appréhender l’usage, l’efficacité et la tolérance des médicaments en dehors du cadre expérimental des essais cliniques, il est important de disposer de quantité massive de « données de vie réelle »*.  

Le docteur Bernard Hamelin, Responsable Global, Medical Evidence Generation de Sanofi, dévoile les enjeux liés à l’utilisation de ce nouveau type de données.

Qu’entend-on par « données de vie réelle » ?

Bernard Hamelin.- Jusqu’à présent, l’essentiel des données disponibles et exploitables autour des traitements était issu d’essais cliniques. Il s’agit principalement d’essais randomisés contrôlés*, dont l’objectif est d’évaluer les effets bénéfiques et les risques associés à une thérapie. Ce type de protocole, emblématique de la médecine fondée sur les preuves, est nécessaire pour solliciter l’autorisation de mise sur le marché d’un nouveau traitement.

Les données de vie réelle* décrivent l’usage d’un traitement dans un environnement non contrôlé : la vie quotidienne du patient tout au long du parcours de soin. Il s’agit, pêle-mêle, de données cliniques issues du dossier médical (notes du médecin à l’occasion des soins de routine, imageries médicales…), d’informations de nature administrative (les traitements et actes pris en charge par le système de santé), de données issues d’objets connectés (à l’instar des dispositifs d’injection connectés développés par Sanofi) ou collectées sur le Web. 

Sur les réseaux sociaux et forums de patients, il est possible de capter des signaux faibles révélant les effets indésirables de certains traitements, et donc d’agir plus rapidement, sans attendre les alertes levées par les circuits traditionnels de la pharmacovigilance*. 

Pour résumer, l’intérêt des données de vie réelle* réside dans le fait qu’elles décrivent la pratique courante et les effets d’un traitement sur la qualité de vie des patients. Des aspects qui ne peuvent pas être capturés lors des essais cliniques.

 

Bernard Hamelin, Responsable Global, Medical Evidence Generation, Sanofi

Quelles sont les sources d’approvisionnement pour les données de vie réelle ?

BH.- Sanofi a lancé en 2017 le projet DARWIN. Cet « entrepôt de données biomédicales » contient des informations relatives à 300 millions de patients et couvre d’ores et déjà plus de 300 maladies. DARWIN agrège des données provenant d’essais cliniques réalisés par Sanofi, et des données externes, en particulier « de vie réelle » acquises auprès de partenaires spécialisés, qui nettoient et anonymisent ces informations conformément aux réglementations en vigueur. 

La majorité des données de vie réelle* provient aujourd’hui des États-Unis. Nous allons en diversifier l’origine géographique. Le Règlement général sur la protection des données (RGPD) adopté en mai 2018 harmonise le cadre juridique au niveau européen. Cette pratique s’accompagne naturellement de l’obligation de tout mettre en œuvre pour garantir la confidentialité des données de santé à caractère personnel. Le défi consiste alors à contrôler l’appauvrissement des données induit par leur anonymisation*. 

 
L’intérêt des données de vie réelle réside dans le fait qu’elles décrivent la pratique courante et les effets d’un traitement sur la qualité de vie des patients. Des aspects qui ne peuvent pas être capturés lors des essais cliniques.
Dr Bernard Hamelin, Responsable Global, Medical Evidence Generation de Sanofi

Qu’apporte l’exploitation de ces données en vie réelle ?

BH.- Les données de vie réelle sont par nature très hétérogènes, et leur quantité quasi infinie. La difficulté est de parvenir à les analyser méthodiquement, en séparant le « bruit » des éléments intéressants. Les progrès récents de l’Intelligence Artificielle (notamment les algorithmes de Machine Learning et Deep Learning) autorisent l’exploitation de ces données, sous la supervision de datascientists. Depuis 18 mois, 45 études ont d’ores et déjà été conduites sur la base de données de DARWIN. Des résultats et applications concrètes vont rapidement émerger.

Les algorithmes, en explorant ce réservoir de données, identifient des modèles dans le but de produire des prédictions. Les objectifs sont multiples : estimer les probabilités de succès d’un traitement sur différentes populations cibles, repérer les besoins non satisfaits par un traitement, élaborer des traitements spécifiques pour des sous-groupes de patients…
D’une manière générale, nous avons l’ambition avec DARWIN de mieux personnaliser les traitements, d’accroître la précision de l’information associée aux médicaments, d’améliorer la pharmacovigilance* en automatisant les processus d’apprentissage continu autour des traitements mis sur le marché.

Dans un contexte caractérisé par la hausse du coût de la santé, lié à l’augmentation des maladies chroniques et au vieillissement de la population, ces outils prédictifs participent également à améliorer l’efficacité économique des systèmes de santé. Si l’on est capable d’identifier par avance les patients qui répondront bien à un traitement, on maximise les bénéfices tout en limitant les risques. Enfin, nous sommes convaincus que la R&D et le développement clinique des médicaments s’appuieront de plus en plus sur les données de vie réelle, ceci pour accélérer et compléter les essais thérapeutiques. L’analyse des données de vie réelle peut permettre de valider par avance la faisabilité d’un protocole d’essai clinique, mais aussi parfois de s’y substituer partiellement.

 
Le point sur la dé-identification et l’anonymisation des données avec Datavaloris

L’IA garante de l’anonymat des patients 

Fondée par Jean-Patrice Glafkidès, la startup Datavaloris a remporté deux des challenges lancés par Sanofi dans le cadre de l’événement VivaTech 2019. L’un d’eux concernait la dé-identification des données de patients.

*Le glossaire pour tout comprendre

  • Données cliniques : les données cliniques sont des informations objectives constatées lors d’essais cliniques d’un médicament ou d’un dispositif médical, réalisés sur des patients en milieu hospitalier. Elles concernent tous les paramètres liés à la performance observée, positive ou négative, du traitement reçu par le patient. 
  • Données de vie réelle (ou « données de vraie vie ») : il s’agit de données qui sont générées à l’occasion des soins réalisés en routine pour un patient, et qui reflètent donc a priori la pratique courante. De telles données peuvent provenir de multiples sources : elles peuvent être extraites des dossiers informatisés de patients, ou constituer un sous-produit des informations utilisées pour le remboursement des soins ; elles peuvent également provenir du web, des réseaux sociaux, des objets connectés, etc.
  • Anonymisation des données : l'anonymisation des données est réservée aux opérations irréversibles. Une anonymisation irréversible consiste à supprimer tout caractère identifiant à un ensemble de données. Concrètement, cela signifie que toutes les informations directement ou indirectement identifiantes sont supprimées ou modifiées, rendant impossible toute ré-identification des personnes.
  • Dé-identification des données : contrairement à l’anonymisation, la dé-identification des données est réversible. Cette technique permet la ré-identification ou l'étude de corrélations en cas de besoin particulier.
  • Essais randomisés : les essais randomisés sont un type d’essai clinique dont les sujets (volontaires, malades ou non) recevant un certain traitement (produit, dosage, méthode...) ou un placébo sont choisis au hasard (random, en anglais). Cela permet d’éviter les biais de sélection, qui pourraient conduire à constituer des groupes différents (origine sociale, historique médical, habitudes alimentaires, situations personnelles, etc.).
  • Pharmacovigilance : la pharmacovigilance est la surveillance des médicaments et la prévention du risque d’effet indésirable résultant de leur utilisation, que ce risque soit potentiel ou avéré.