MONIR NASSER EDDINE


9h30

Soutenance de thèse de NASSER EDDINE MONIR

Évaluation et Fonctions de Coût à l'Échelle Phonémique pour le Rehaussement de la Parole Multicanal

Phoneme-Level Evaluation and Training Losses for Multichannel Speech Enhancement

Jury

Directeur de these_SERIZEL_Romain_Université de Lorraine
CoDirecteur de these_MAGRON_Paul_Centre Inria de l'Université de Lorraine
Examinateur_DUCOURNEAU_Joël_Université de Lorraine
Examinateur_MAY_Tobias_Danmarks Tekniske Universitet
Examinateur_ARZOUNIAN_Dorothée_Institut Pasteur
Président_MARXER_Ricard_Université de Toulon
Rapporteur_GRAETZER_Simone_University of Salford

école doctorale

IAEM - INFORMATIQUE - AUTOMATIQUE - ELECTRONIQUE - ELECTROTECHNIQUE - MATHEMATIQUES

Laboratoire

LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications

Mention de diplôme

Informatique
C005 Bâtiment A, Campus Scientifique, 615 Rue du Jardin-Botanique, 54506 Vandœuvre-lès-Nancy
*

Mots clés

Rehaussement de la parole multicanal,Évaluation à l'échelle phonémique,Fonctions de coût,

Résumé de la thèse

La communication vocale en environnements acoustiques complexes demeure un défi majeur, en particulier pour les personnes malentendantes ainsi que pour les systèmes de reconnaissance automatique de la parole (ASR). Bien que l'apprentissage profond ait permis des avancées significatives en rehaussement de la parole multicanale, la plupart des approches existantes reposent sur des critères d'optimisation globaux définis à l'échelle de la phrase.

Keywords

Multichannel speech enhancement,Phoneme-based evaluation,Loss functions,

Abstract

Speech communication in complex acoustic environments remains a significant challenge, particularly for hearing-impaired individuals and automatic speech recognition (ASR) systems. While deep learning has significantly advanced multichannel speech enhancement, most existing frameworks rely on global, utterance-level optimization criteria.