Skip to main content

Interhop - LinkR

Développer des plugins qui apporteront de nouvelles fonctionnalités low-code à l’application, aidant ainsi les cliniciens et data scientists à analyser les données de santé

A RETENIR

  • Projet - Interhop - LinkR

Description courte

LinkR est une plateforme collaborative open source de data science en santé permettant aux cliniciens et data scientists d'analyser les données des entrepôts hospitaliers de manière décentralisée.

Description longue

LinkR est une solution innovante développée par l'association InterHop qui vise à démocratiser l'accès et l'analyse des données de santé dans les hôpitaux. La plateforme combine une interface low-code pour les cliniciens avec des capacités de programmation avancées pour les data scientists, tout en respectant une approche décentralisée de gestion des données.

Description du livrable

La plateforme LinkR se présente sous forme d'une application web avec une interface de type dashboard permettant la visualisation et l'analyse des données de santé. Elle intègre des plugins pour différentes fonctionnalités (prétraitement des données, machine learning, visualisation) et supporte à la fois R et Python. L'interface permet aux cliniciens d'effectuer des analyses via une interface graphique intuitive, tandis que les data scientists peuvent accéder et modifier directement le code généré.

Contexte et importance du projet

Le projet LinkR s'inscrit dans un contexte où les hôpitaux disposent d'énormes quantités de données de santé stockées dans des entrepôts de données, représentant un potentiel considérable pour la recherche médicale. Cependant, ces données sont actuellement sous-exploitées pour trois raisons principales :

  1. Le manque d'Hérabilité entre les différents systèmes hospitaliers, chaque établissement utilisant des formats et des logiciels différents, ce qui complique la mise en commun des données pour la recherche multi-centres.

  2. La nécessité de compétences avancées en programmation (Python, R, SQL) pour analyser ces données, compétences qui ne font pas partie du cursus médical standard.

  3. L'absence d'outils collaboratifs adaptés permettant aux cliniciens et aux data scientists de travailler ensemble efficacement sur ces données.

L'importance du projet se manifeste également dans le contexte actuel de la gestion des données de santé en France, où des questions de souveraineté numérique se posent, comme l'illustre l'autorisation récente par la CNIL de l'hébergement des données de santé par Microsoft.

Réalisations pendant la saison

Durant la saison d'accélération, l'équipe a réalisé plusieurs avancées significatives :

  1. Développement de plugins essentiels :

    • Outils de prétraitement des données
    • Fonctionnalités de détection et suppression des données aberrantes
    • Modules de train-test split
    • Plugins de machine learning
    • Outils de visualisation (timeline, data table)
  2. Amélioration de l'Hérabilité :

    • Intégration plus poussée de Python aux côtés de R
    • Adaptation de la plateforme pour répondre aux besoins des deux communautés (R en médical, Python en data science)
  3. Refonte de l'interface utilisateur :

    • Création d'une interface type dashboard plus dynamique
    • Amélioration de l'éditeur de plugins
    • Intégration harmonieuse des fonctionnalités R et Python
  4. Mise en place d'une architecture permettant une approche décentralisée de la gestion des données

Résultats et impact

Le projet a abouti à plusieurs résultats concrets :

  1. Une plateforme fonctionnelle permettant :

    • La visualisation interactive des données de santé
    • L'analyse collaborative entre cliniciens et data scientists
    • La génération automatique de code à partir d'interactions graphiques
    • Le support de multiples formats de données et langages de programmation
  2. Des partenariats établis :

    • Collaboration active avec le CHU de Rennes
    • Ouverture vers d'autres centres hospitaliers universitaires
    • Création d'une communauté de bénévoles contributeurs
  3. Des perspectives concrètes :

    • Organisation d'un datathon prévu pour septembre 2024 à Rennes
    • Développement prévu d'une preuve de concept pour l'approche décentralisée
    • Intégration future du standard FHIR

L'impact principal du projet est de démocratiser l'accès aux données de santé pour la recherche médicale, tout en garantissant leur sécurité et leur confidentialité grâce à une approche décentralisée. Il contribue également à créer des ponts entre les communautés médicales et data science, facilitant ainsi l'innovation dans la recherche en santé.