Mémoires de Fin d’Etudes
Etablissement
Université 8 mai 1945 de Guelma
Affiliation
Département d’Informatique
Auteur
BENATI, Nadia
Directeur de thèse
Pr Seridi Hamid (Professeur)
Filière
Informatique
Diplôme
Magister
Titre
Détection de mots clefs dans un flux de parole basée sur une approche perceptuelle
Mots clés
Détection. mots .clefs. flux . parole. basée . approche. perceptuelle.
Résumé
Les premières approches de la recherche d’information dans un contenu parlé ont d’abord utilisé des techniques similaires à celle développées pour les documents textuels, appliquées à la transcription automatique du flux de parole. Un système de reconnaissance automatique de la parole est appliqué à un ensemble de fichiers audio et génère une transcription de la parole. Cette transcription est alors indexée et une recherche est alors lancée par un système de recherche. Le résultat fourni pour une requête est une liste de pointeurs vers des fichiers audio. En détection de mots clés, le but est de reconnaître les mots clés dans un flux de parole continue, indépendamment du locuteur. La détection de mots clés résout quelques problèmes liés à la reconnaissance de la parole continue comme les hésitations, les faux départs, les phrases grammaticalement incorrectes, les phrases tronquées, etc. Dans ce mémoire, nous avons proposé une approche qui peut être considérée comme une autre voie que la transcription textuelle des discours en vue de l’exploitation des bases de données audio, en offrant une méthode qui se fonde principalement sur le signal acoustique avant sa transcription phonétique. Nous avons proposé une méthode qui tente de localiser un mot clef dans un flux audio en se basant sur la détection de certaine de ses caractéristiques. Ainsi, la détection d’un mot clef est réalisée par la détection d’un son particulier dans le mot c’est-à-dire d’une unité infra-lexicale, et à partir de cet « ilot de confiance », on peut chercher dans l’intervalle considéré le mot à reconnaître. Lorsque ces unités sont détectées dans le discours un appariement avec les modèles des mots clefs qui contiennent ces unités est effectué. L’évaluation de cette approche est faite sur la langue arabe, langue où peu de travaux ont été menés aussi bien en reconnaissance de la parole qu’en recherche d’information.
Date de soutenance
Année : 2008
Cote
004
Pagination
85 PAGES
Illusatration
relieure
Format
PDF
Statut
Traitée