Apprentissage automatique multimodal évolutif, explicable et fédéré pour l'aide à la décision

Offre de thèse

Date limite de candidature

31-05-2026

Date de début de contrat

01-10-2026

Directeur de thèse

ARIDHI Sabeur

Encadrement

Supervision and contact: Sabeur Aridhi : sabeur.aridhi@loria.fr ET Yannick Toussaint : yannick.toussaint@loria.fr

Type de contrat

ANR Financement d'Agences de financement de la recherche

Candidater à cette offre

école doctorale

IAEM - INFORMATIQUE - AUTOMATIQUE - ELECTRONIQUE - ELECTROTECHNIQUE - MATHEMATIQUES

équipe

contexte

L'apprentissage automatique appliqué à des données complexes et hétérogènes soulève aujourd'hui plusieurs défis fondamentaux en informatique : ●apprentissage multimodal : comment apprendre efficacement à partir de sources hétérogènes (texte, signal, image, données structurées) avec données manquantes et bruitées ; &#9679;explicabilité : comment concevoir des modèles interprétables ou capables de fournir des explications fiables, stables et utiles ; &#9679;intégration de connaissances : comment combiner apprentissage statistique et connaissances structurées (ontologies, knowledge graphs) ; &#9679;apprentissage distribué et fédéré : comment apprendre à partir de données réparties sans centralisation, en présence d'hétérogénéité ; &#9679;passage à l'échelle : comment concevoir des modèles et pipelines capables de gérer de grands volumes de données, de modalités et d'utilisateurs tout en restant efficaces. Ces défis sont au cœur de plusieurs domaines de recherche en IA moderne, notamment le multimodal learning, le trustworthy AI, les knowledge-enhanced models, et les distributed learning systems.

spécialité

Informatique

laboratoire

LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications

Mots clés

Apprentissage multi modale, apprentissage fédéré, IA distribué

Détail de l'offre

Cette thèse s'intéresse aux défis de l'apprentissage automatique sur des données complexes et hétérogènes, en particulier en santé. Elle aborde des enjeux clés comme l'apprentissage multimodal (combiner textes, images, signaux), l'explicabilité des modèles, l'intégration de connaissances (via des ontologies), l'apprentissage distribué (notamment fédéré), et le passage à l'échelle des modèles. Les objectifs sont de développer des méthodes robustes, explicables, et scalables, en intégrant des connaissances, et en respectant la confidentialité des données. Ces approches seront appliquées dans le cadre du projet RHU I-DEAL, visant à améliorer les systèmes d'aide à la décision clinique pour le suivi de la maladie de Crohn, avec des données multimodales collectées à distance. La démarche est itérative, avec un développement méthodologique, une validation sur des benchmarks, et une application concrète sur les données cliniques du projet.

Keywords

Multimodal AI, Federated learning, Scalable AI

Subject details

This thesis addresses the challenges of machine learning applied to complex and heterogeneous data, particularly in healthcare. It tackles key issues such as multimodal learning (combining text, images, signals), model explainability, integration of knowledge (via ontologies), distributed (federated) learning, and scaling of models. The goals are to develop robust, explainable, scalable, and distributed multimodal learning methods for analyzing heterogeneous data in healthcare. The scientific and methodological objectives include: designing multimodal learning models that effectively integrate diverse data (text, audio, video, questionnaires), developing robust approaches to noisy or incomplete data, creating explainability methods for reliable clinical interpretations, integrating structured knowledge (ontologies, expert knowledge) into models, implementing federated learning that preserves sensitive data privacy, and ensuring computational efficiency and scalability. These methods will be applied and evaluated in the ANR RHU I-DEAL project, aimed at developing clinical decision support systems for monitoring Crohn's disease, using multimodal patient data collected remotely. The methodology is iterative, combining methodological development, benchmarking validation, adaptation to the I-DEAL project, and multi-criteria evaluation (performance, explainability, robustness, scalability, and federated communication cost).

Profil du candidat

Le candidat doit posséder :
Un master en informatique, IA, data science ;
bases solides en machine learning, Python (scikit-learn, PyTorch ou
équivalent)
Une maîtrise de l'apprentissage automatique (apprentissage profond) ;
Un bon niveau d'anglais (écrit et oral) ;
D'excellentes compétences rédactionnelles.
Atouts :
-multimodal learning
-XAI
-knowledge graphs
-distributed systems / federated learning
-optimisation / HPC

Candidate profile

The candidate must possess:
A Master's degree in Computer Science, AI, or Data Science;

A solid foundation in machine learning and Python (scikit-learn, PyTorch, or equivalent);

Proficiency in machine learning (deep learning);
A good level of English (written and spoken);

Excellent writing skills.

Strengths:
-Multimodal learning
-XAI
-Knowledge graphs
-Distributed systems/Federated learning
-Optimization/HPC

Référence biblio

●A Bajracharya, Y Toussaint, S Aridhi. Comparative Analysis of Multimodal
Fusion Techniques for Clinical Severity Classification. IEEE International
Conference on Big Data (IEEE Big Data 2025), 6220-6227
&#9679;C Le Berre, WJ Sandborn, S Aridhi, MD Devignes, L Fournier, et al.
Application of artificial intelligence to gastroenterology and hepatology.
Gastroenterology 158 (1), 76-94. e2
&#9679;Abbas Q, Jeong W, Lee SW. Explainable AI in Clinical Decision Support
Systems: A Meta-Analysis of Methods, Applications, and Usability
Challenges. Healthcare (Basel). 2025 Aug 29;13(17):2154. doi:
10.3390/healthcare13172154. PMID: 40941506; PMCID: PMC12427955.
&#9679;Karthik Shivashankar, Ghadi Al Hajj, and Antonio Martini. 2025.
Maintainability and Scalability in Machine Learning: Challenges and Solutions.
ACM Comput. Surv. 57, 12, Article 318 (December 2025), 36 pages.
https://doi.org/10.1145/3736751
&#9679;Ming Li, Pengcheng Xu, Junjie Hu, Zeyu Tang, Guang Yang. From challenges
and pitfalls to recommendations and opportunities: Implementing federated
learning in healthcare. Medical Image Analysis, Volume 101,2025, 103497,
ISSN 1361-8415.
&#9679;Felix Krones, Umar Marikkar, Guy Parsons, Adam Szmul, Adam Mahdi. Review of
multimodal machine learning approaches in healthcare. Information Fusion, Volume
114, 2025, 102690, ISSN 1566-2535.
&#9679;Sören Richard Stahlschmidt, Benjamin Ulfenborg, Jane Synnergren, Multimodal
deep learning for biomedical data fusion: a review, Briefings in Bioinformatics,
Volume 23, Issue 2, March 2022, bbab569