Big Brother pour certains, réponse miraculeuse à tous les problèmes pour d’autres, le Big Data est un sujet à la mode. Dans la santé, cette avancée technologique porte de nombreux espoirs.

Big Data : comment ça marche ?

Le Big Data définit un ensemble énorme de données informatiques répondant à trois critères. C’est la règle des trois V :

  • Volume : les données doivent être extrêmement nombreuses et volumineuses, impossibles à traiter avec des outils classiques.
  • Variété : les données sont très éclectiques. Elles viennent de sources différentes, leur format peut varier. Bref, c’est le désordre.
  • Vélocité : les données doivent être créées, collectées et partagées très rapidement.

D’où viennent les données ?

De nous, principalement. Chacune de nos actions sur le web ou sur nos téléphones génère une trace : historique de navigation, photos, historique des commandes en ligne, etc. Des milliers de données existent pour chacun d’entre nous. À ces informations s’ajoutent les données recueillies par l’État, par l’Assurance Maladie, les études scientifiques, démographiques, etc.

Chaque jour, l’humanité crée 2.5 milliards de gigas octets de données. Et ces données sont collectées par différents acteurs. Les géants du web, Facebook, Google, Amazon et Apple (les fameux GAFA) sont les plus connus. Mais les éditeurs d’applications et de sites internet aspirent également nos données, ainsi que des sociétés spécialisées ou même des organismes publics.

Pourquoi les données sont-elles collectées ?

  • Pour être analysées dans le cadre de la recherche scientifique
  • Pour dénicher de nouvelles tendances
  • Pour élaborer des statistiques

Les applications du Big Data sont très nombreuses.

Comment les données sont traitées?

Par des systèmes informatiques complexes développés spécialement pour traiter de grandes quantités de données. Le Big Data a entraîné la création de nouveaux métiers, spécialisés dans l’extraction et la vérification de données numériques.

Le Big Data est intimement lié au développement de l’Intelligence Artificielle. En effet, les grandes quantités de données collectées permettent “d’entraîner” les algorithmes qui sont à la base des IA. Et seules des IA sont en mesure de traiter de manière pertinente le gigantesque désordre du Big Data.

Le Big Data est-il infaillible ?

Pas encore. Disposer d’un très grand nombre de données ne garantit pas que ces données soient fiables. Et plus on dispose de données, plus leur traitement est complexe. Des erreurs et des imprécisions sont encore possibles. C’est l’un des défis pour le Big Data.

Big Data : Et la santé dans tout ça ?

Les progrès informatiques ont des conséquences concrètes dans le secteur de la santé. Exemple :

  • Il a fallu 10 ans de travail pour obtenir la première séquence du génome humain, en 2003.
  • Aujourd’hui cette opération prend moins d’une journée.

Que ce soit à l’hôpital, dans les cabinets médicaux, dans les administrations ou les mutuelles, les ordinateurs sont partout. Ils pilotent les outils médicaux, stockent les résultats, les dossiers, etc. Ils génèrent chaque jour des milliards de données, auxquelles s’ajoutent les informations produites par les objets connectés ou par nos applications. Finement analysées, ces informations peuvent permettre de nombreux progrès.

Prévenir et traiter les maladies

Les informations récoltées à long terme sur de très larges populations vont permettre d’obtenir des statistiques très précises. De là, il sera possible de repérer les facteurs de risques pour certaines maladies comme le cancer, le diabète, l’asthme.

De même, l’intelligence artificielle permet déjà de personnaliser le traitement pour certains malades du cancer. Le super-ordinateur Watson, développé par IBM, analyse en quelques minutes le résultat d’une analyse génétique du patient, compare ses paramètres à la masse des données existantes, et propose des pistes de stratégie thérapeutique. Ce travail pouvait auparavant prendre plusieurs semaines.

Prédire les épidémies

Les données recueillies dans toutes les régions du monde permettent d’anticiper les problèmes de santé auxquels vont faire face les populations qui y vivent. Les données sur le comportement alimentaire ou la consommation d’alcool, par exemple, peuvent permettre d’anticiper les risques de cancers et de maladie cardiovasculaires. Et d’orienter les politiques de prévention.

À partir des informations partagées par les autorités sanitaires du monde entier, la carte Health Map permet par ailleurs de visualiser les risques épidémiques partout dans le monde. D’autres systèmes prennent en compte le trafic aérien pour anticiper le déplacement d’une épidémie d’un pays à un autre.

Mieux surveiller les médicaments

Le Big Data pourrait permettre de vérifier beaucoup plus rapidement l’efficacité ou la dangerosité des médicaments, notamment des vaccins, dès l’étape cruciale des essais cliniques.

L’analyse des données croisant la vente de médicaments et la survenue d’événements sanitaires peut également permettre de faire des rapprochements entre l’usage de certains traitements et la survenue de certains problèmes de santé.

Big Data et santé : des défis éthiques

Les données recueillies dans le cadre d’essais cliniques ou par des chercheurs font l’objet d’un consentement explicite du patient, et d’une déclaration à la CNIL. Mais dans le cadre du Big Data, d’autres données peuvent être utilisées : historiques de navigation internet, recherches en ligne, informations produites par les objets connectés, etc.

Le respect de l’anonymat et la prise en compte de la volonté des citoyens qui ne souhaitent pas partager leurs informations sont alors des enjeux réels. L’entrée en vigueur du Règlement Général pour la Protection des Données en mai 2018 a permis de renforcer les droits des citoyens sur leurs données personnelles.

Mais de nombreuses autres questions se posent : comment éviter que les GAFA monopolisent ces données ? Comment garantir la transparence du traitement de ces données, et permettre au citoyen d’exercer ses droits ? Faut-il conserver toutes les données ?

Un cadre juridique et technique qui se précise

Il existe en France plus de 200 bases de données publiques relatives à la santé. La plus riche est le SNIIRAM, le Système national d’information interrégimes de l’Assurance maladie. Y sont enregistrés tous les remboursements effectués pour chaque cotisant tout au long de sa vie : médicaments, consultations, trajets en ambulance, etc.

À terme, ce fichier sera réuni au sein d’une base plus large : le Système National des Données de Santé. Géré par l’Assurance maladie, ce système permettra de chaîner des données aujourd’hui disparates :

  • les données de l’Assurance Maladie (base SNIIRAM)
  • les données des hôpitaux (base PMSI)
  • les causes médicales de décès (base du CépiDC de l’Inserm)
  • les données relatives au handicap (en provenance des MDPH – données de la CNSA)
  • un échantillon de données en provenance des organismes d’Assurance Maladie complémentaire

Ces données sont accessibles sur autorisation à toute personne ou organisme à des fins de recherche, d’étude ou d’évaluation d’intérêt public. Plusieurs conditions sont posées :

  • Les données accessibles ne doivent pas permettre l’identification des personnes : elles sont rendues anonymes

Les travaux ne peuvent aboutir à :

  • promouvoir des produits en direction des professionnels de santé
  • permettre l’exclusion de garanties des contrats d’assurances, ou la modification de cotisations ou de primes d’assurances

La CNIL et l’institut National des Données de Santé sont chargés d’évaluer les demandes, et d’autoriser ou non les accès en fonction des critères prévus par la loi.

POUR ALLER PLUS LOIN

Intelligence Artificielle et Santé : des algorithmes au service de la médecine — Inserm

Système national des Données de Santé — SNDS

Sources

Big Data en Santé— Inserm

Processus d’accès aux données — SNDS

Tous nos articles sont rédigés avec l’aide de professionnels de santé de La Réunion.