Abstract:
La conception d’un système de reconnaissance nécessite de porter un soin particulier à chacune des étapes (prétraitement, extraction de paramètres, modélisation,……). Au niveau d’extraction de paramètres les coefficients MFCC , LPCC ou LPC ont permis d'obtenir les meilleurs résultats en reconnaissance de mots isolés, mots enchaînés et parole continue dans des conditions de laboratoire ou pour des tâches simples. En revanche, dans des conditions réelles de traitement de la parole (milieu bruité, parole spontanée. . .), les performances de ces systèmes se dégradent considérablement. Ceci nous a motivé d’étudier et de mettre en oeuvre des nouveaux paramètres acoustiques qui peuvent améliorer, soit la robustesse aux bruits, soit le taux de reconnaissance ou d’obtenir les mêmes performances avec un nombre réduit de paramètres.
Les représentations en ondelettes présentent des propriétés intéressantes pour paramétriser le signal de parole. L'objet de notre travail est donc de développer un système de reconnaissance de chiffres arabes isolés (de 0 à 9) multi-locuteur basé sur les modèles de Markov cachés continus et de déterminer l'apport des représentations en ondelettes sur le taux de reconnaissance. Lors de cette tâche, nous avons comparé les différentes techniques de paramétrisation provenant de la transformée en ondelettes avec celles-ci de l’état de l’art.
Les paramètres classiques LPC, MFCC et LPCC sont testés tout d’abord, les nouveaux paramètres sont ensuite proposés et évalués.
Afin de valider nos paramétrisations, nous avons choisi au premier temps la plate forme logiciel HTK, mais nous avons trouvé des difficultés d’intégrer nos sous-programmes concernant les nouveaux paramètres. On a fait recours au matlab qui contient un toolbox pour les ondelettes.