Résumé:
Le domaine de la reconnaissance de la parole est devenu l‟un des sujets de recherches les plus intéressants en traitement de signal. Ceci est dû en particulier aux performances de traitements et de calculs que permettent les ordinateurs actuels. Cependant les systèmes actuels restent limités en matière de robustesse, et doivent donc performer, dans le futur, leur capacité à s‟adapter dans différents environnements, comme par exemple dans les surfaces commerciales, les champs de bataille ou d‟autres scénarios où le bruit de fond est inévitable.
On distingue usuellement e reconnaissance de la parole l‟approche analytique et l‟approche globale. La première approche cherche à traiter la parole continue en décomposant le problème, le plus souvent en procédant à un décodage acoustico-phonétique exploité par des modules de niveau linguistique. La seconde consiste à identifier globalement un mot ou une phrase en les composant avec des références enregistrées.
A ce stade deux possibilités de modélisation se proposent à nous. Le modèle déterministe et le modèle stochastique ; le modèle déterministe exploite généralement quelques propriétés du signal en vue de sa modélisation, comme par exemple la forme du signal (sinusoïde, somme d‟exponentielles, amplitude...). La modélisation stochastique quant à elle, elle essaie de déterminer les caractéristiques statistiques du signal. On parle dans ce cas spécialement de fonctions de distribution de probabilité (Gaussienne, Poisson …).
Pour des applications de traitement de la parole, les deux modèles ont abouti à d‟excellents résultats. Nous allons nous concentrer sur un seul type de modélisation stochastique, en l‟occurrence les modèles de Markov cachés (HMM).En outre, ces modèles donnent de remarquables résultats en pratique quand ils sont correctement appliqués.
V