Dans une société qui se numérise à un rythme accéléré dans tous les secteurs, la santé n’échappe pas à la mise en données. Amenée à révolutionner les modèles et systèmes de soin dans le monde, la transformation numérique de la santé est aujourd’hui en phase d’accélération. Comment répondre aux nouveaux enjeux liés à la production des données massives (big data) de santé ?
Face à la multiplication des sources de production des données de santé et le développement de nouvelles pratiques, des questions se posent en termes d’usage, d’accès et de sécurité des données de santé.
Un nouveau contexte de « production » de données de santé massives
En France, les données de santé proviennent de multiples sources : les bases de données médico-administratives comme par exemple le SNIIRAM (Système national d’information inter-régimes de l’Assurance maladie) et ses 8,9 milliards de feuilles de soins, les images des 80 millions d’actes d’imagerie effectués chaque année, les cohortes et registres, les dossiers médicaux, les essais cliniques, les données patients collectées via les smartphones, les réseaux sociaux et les sites internet…
Elles sont donc disparates et d’une grande diversité de formats, car toutes ces données ont été recueillies pour un usage bien spécifique : diagnostiquer une maladie, détecter une mutation particulière dans le génome, rembourser des soins, mesurer son activité physique, etc.
Cette collecte de données de santé est aujourd’hui monnaie courante : elle est effectuée par les professionnels de santé (dossier médical, essais cliniques, analyses ADN) ou par les individus eux-mêmes via différents objets connectés (montre, bracelet, vêtement), applications, réseaux sociaux, etc. Non seulement le croisement de ces données produit une synergie entre les différents acteurs du système de santé, mais il permet aussi la mise en place d’un suivi des patients en temps réel et à distance (domicile, hôpital, etc).
Et la production des données de santé va continuer à s’intensifier dans les prochaines années. Selon une étude du cabinet Grand View Research, le secteur mondial de la santé investira près de 410 milliards de dollars dans les dispositifs IoT, logiciels et services en 2022. Et ce alors qu’il ne représentait que 46 milliards en 2015 ! Il y aurait déjà plus de 161 millions d’objets de santé connectée en libre circulation à travers le monde en 2020.
L’utilisation des données de santé par l’IA
L’intelligence artificielle (IA) vient bouleverser la donne en cherchant à utiliser toutes ces data dans l’objectif de faire progresser la recherche, les soins et l’innovation en santé. Comment ? en annotant et en appariant les données pour obtenir des résultats plus fiables et de meilleure qualité, mais aussi pour faire surgir des hypothèses et des liens qui n’étaient pas envisagés. A une condition : recueillir un nombre suffisant de données exploitables pour faire tourner les algorithmes de l’IA.
Quand on sait qu’il faut près de 100 000 images pour que les algorithmes de l’IA puissent apprendre à détecter un mélanome et poser un diagnostic sûr, on comprend qu’un hôpital seul ne peut collecter le nombre de données nécessaires. Les producteurs de données doivent donc s’associer pour collecter, échanger, partager leurs données.
Il faut aussi s’assurer de pouvoir disposer de données « propres », rangées et bien étiquetées. Les systèmes dotés d’intelligence artificielle, de techniques de machine learning et de puissances de calcul importantes permettront de synthétiser et de modéliser des données complexes pour affiner un diagnostic, identifier les mutations génétiques en cause, surveiller la croissance tumorale, aider à la prise de décision des médecins, etc.
Des données sensibles à anonymiser, stocker et sécuriser
Alors que le domaine de la santé représente désormais un marché presque sans limite, des questions se posent en termes d’usage, d’accès et de sécurité des données de santé. Ces données sont souvent « sensibles » car elles touchent à l’intimité des personnes. Le secret médical reste un gage de confiance mais aussi un principe de sécurisation, au-delà du partage des données personnelles.
Depuis 40 ans, avec la loi Informatique et libertés, elles sont particulièrement protégées en France. Car si elles « tombaient » dans les mains d’un employeur, d’une banque, d’une assurance, elles constitueraient de formidables leviers potentiels de discrimination individuelle et collective. Avec le RGPD, cette protection est renforcée. Cependant, les acteurs de la e-santé revendiquent un accès aux données pour inventer et offrir de nouveaux services. En effet, si la donnée appartient juridiquement au malade, en étant anonymisée, sécurisée, non divulguée, elle peut servir la communauté des patients et les avancées de la recherche.
L’accès aux bases de données, comme celles du SNDS (Système national des données de santé) qui regroupe les principales bases de données de santé publiques existantes en France, s’ouvre progressivement, en restant très réglementé : une première couche de données agrégées, complètement anonymisées, est en « open data » ; une deuxième couche de données « pseudonymisées » voit son accès possible pour des acteurs publics ou privés avec une procédure très lourde ; enfin, une troisième est en accès permanent pour une liste limitatives d’acteurs publics.
A la suite des États généraux de la bioéthique, le Comité Consultatif National d’Éthique (CCNE) note dans son rapport publié en mai 2019 que « les technologies reposant sur la numérisation mettent en évidence la nécessité – pour qu’un pays garde la maîtrise de sa politique de santé et de sa capacité à l’innovation scientifique et médicale – d’affronter les défis technologiques du stockage et de la sécurité, ainsi que d’assurer un haut niveau scientifique et technologique pour l’exploitation des données ».
Autant de défis passionnants à relever par les ingénieurs e-santé dans les années à venir, auxquels la majeure Santé biotech tente de répondre grâce à ses enseignements mixant sciences du vivant et de l’humain, technologies, informatique et Big Data/Intelligence artificielle.