CELYA > Actualits affichs en page d'accueil


Soutenance de thse de Thibaud Leclere le mercredi 09 dcembre 2015 :"Towards a binaural model for predicting speech intelligibility among competing voices in rooms"

Share |

le 9 dcembre 2015 /

Towards a binaural model for predicting speech intelligibility among competing voices in rooms


Abstract 

This PhD work aims to propose a model predicting the perceived intelligibility of a target speech masked by competing sources in rooms. An existing model developed by Lavandier and Culling (2010) is already able to predict speech intelligibility of a near-field target in the presence of multiple noise sources. The present work deals with new implementations and experimental work needed to extend the model to the case of a distant target and to the case of masking voices, which present different acoustical properties than noises(envelopefluctuations, fundamentalfrequency, modulations of fundamental frequency). The detrimental effect of reverberation on the target speech has been successfully implemented. This new version of the model provides a unified interpretation of several perceptual effects previously observed in the literature but it presents a room dependency which limits its predictive power. Experimental work has been conducted to determine how the model could account for sources presenting different spectra, and to account for several auditory mechanisms operating simultaneously (F0 segregation, spatial unmasking and temporal dip listening).

Résumé
Ce travail de thèse vise à proposer un modèle pouvant prédire l’intelligibilité d’une voix cible masquée par des sources concurrentes dans les salles. Un modèle a déjà été développé par Lavandier et Culling (2010) et est capable de prédire l’intelligibilité d’une cible en champ proche perturbée par plusieurs sources de bruit. Le travail présenté ici traite des nouvelles implémentations et expérimentations nécessaires pour étendre le modèle au cas de cibles distantes et au cas de voix concurrentes, qui présentent des propriétés acoustiques différentes des bruits stationnaires (fluctuationd’enveloppe,fréquence fondamentale, modulations de fréquence fondamentale). L’effet nuisible de la réverbération sur la parole cible a été implémenté avec succès. Cette nouvelle version du modèle permet une interprétation unifiée de plusieurs effets perceptifs observés dans la littérature mais il présente une dépendance de la salle, ce qui limite son aspect prédictif. Des travaux expérimentaux ont été menés pour déterminer comment le modèle pourrait prendre en compte le cas de sources cibles et masquantes avec des spectres différents ainsi que le cas où plusieurs mécanismes auditifs opèrent simultanément (ségrégation par F0, démasquage spatial et écoute dans les creux de modulation).

 Jury : Christian Lorenzi (ENS, Rapporteur), Torsten Dau (DTU, Rapporteur), Etienne Parizet (INSA, Examinateur), Olivier Macherey (LMA, Examinateur), Mathieu Lavandier (ENTPE, Directeur de thèse), Dominique Dumortier (ENTPE, Directeur de thèse HDR)

Complément date : 
Mercredi 09 décembre 2015 à 13h30 
Lieux : 
Amphithéâtre Michel Prunier, ENTPE,
69518 Vaulx-en-Velin