Offre de stage LGI2P IMT Mines Alès / Euromov UM – 5 Santé

Contexte

Après la mise en place de la T2A dans les établissements MCO en 2004, c’est au tour des structures de Soins de Suite et de Réadaptation (SSR) d’observer une réforme de leur financement. C’est la réforme de la DMA (Dotation Modulée à l’Activité)

La réforme de la DMA prévoit de faire évoluer le financement des établissements SSR vers un financement définit sur la base des éléments présentés ci-dessous.

Cette évolution va complexifier les modalités de codage et de tarification mais également en pratique impacter la durée des séjours. 

En effet, alors qu’aujourd’hui les SSR fonctionnent avec un prix de journée « fixe » et une durée de séjour moyenne de 28j, cette réforme va conduire les établissements à envisager des durées de séjours variables et notamment plus courts pour des patients considérés comme moins « lourds » afin de rester économiquement viables.

Objectif du projet

L’objectif de ce projet sera donc de développer une solution permettant à partir de l’information disponible dans les bases du Groupe 5 Santé (dossier médical …) :

  • de classer automatiquement les patients selon les nouveaux principes de classifications et de tarification ;
  • de proposer une aide aux experts PMSI/médecins dans l’orientation du patient vers le parcours de soin le plus pertinent médicalement (qui se fera essentiellement sur une modulation de la durée de séjour), tout en intégrant en parallèle une optimisation économique des établissements de santé.

Méthodologie envisagée

Pour se faire, le candidat mettra en œuvre différentes approches d’Apprentissage Automatique permettant la prédiction de la pertinence des orientations envisagées pour ainsi recommander aux médecins l’orientation correspondant le mieux à chaque patient. Il proposera également un codage optimal des actes selon les référentiels standardisés des actes de soins et des tarifications

Un élément important dans l’identification de l’orientation et du parcours de soin optimaal est l’exploitation de l’historique du patient, qui se présente souvent sous la forme de dossiers patients électroniques, regroupant l’ensemble des informations médicales sur les séjours précédents du patient (prescriptions, résultats d’analyses, mais surtout rapports d’hospitalisation non structurés). Cette exploitation passe avant

1

tout par l’identification de concepts et de termes se rapportant aux terminologies standardisées et aux nomenclatures de codage médicales, au travers de techniques d’annotation sémantique, de reconnaissance de concepts dans le texte et de contextualisation (négation, temporalité, si cela concerne le patient on non), qui serviront ensuite de base (caractéristiques/features) pour l’application de techniques d’apprentissage automatique. 

Une première étape importante sera ainsi de créer un jeu de données d’entrainement plus ou moins labélisé (éventuelle imputation de la pertinence des orientations d’ancien patients) sur la base d’une part de cette phase d’annotation à l’échelle de tous les rapports d’hospitalisation et en partenariat avec les experts concernés (médecins et PMSI).  

Problématiques d’ordre technologiques

L’exploitation de rapports d’hospitalisation, pose des problèmes évidents d’éthique et de confidentialité.  D’une part, le travail s’effectuera obligatoirement sur des données désidentifiées (anonymisation faible). D’autre part, les données ne pourrons sortir de l’établissement ou transiter sur le réseau. Ainsi, il faudra mettre en place le système directement au sein du système informatique de la clinique et déployer les outils d’annotation sémantique et les terminologies nécessaires. Nous travaillerons  en particulier avec la technologie NCBO BioPortal (Stanford University) et sa version Française développée en collaboration avec le LIRMM. 

Organisation

  • Lieu de stage : Clinique du Souffle la Vallonie à LODEVE (34 800)
  • Période et durée du stage : Durée 4 à 6 mois avec démarrage vers mars-avril 2019 ▪ Gratification : 
    • 15% du plafond horaire de la sécurité sociale, de l’ordre de 560€ par mois
    • Indemnité de double résidence
    • Peut déboucher, en cas de succès, sur une mission de mise en place de la solution pour l’ensemble du groupe
  • Formation : Master 2/école d’ingénieurs en Science des données/Statistique ou Informatique avec une forte composante Science des données/Statistique ▪ Compétences requises : 
    • Bonnes connaissances théoriques et pratiques des principales approches d’apprentissage automatique
    • Aisance en développement, le/la candidat(e) devra être en mesure de rapidement implémenter (Python ou R) et comparer les approches.
    • Idéalement, connaissances en DevOps (développement et déploiements opérationnels) en particulier avec docker et en administration système Unix.
  • Divers : 
    • Aisance relationnelle 
    • Autonomie
    • Intérêt pour le domaine de la Santé

Contact : Gérard Dray IMT Mines Alès, gerard.dray@mines-ales.fr