Etablissement
Ecole Nationale Supérieure d'informatique
Affiliation
Département de Post-Graduation
Auteur
OUFAIDA, Houda
Directeur de thèse
NOUALI, Omar (Docteur)
Filière
Informatique
Diplôme
Doctorat
Titre
Extraction d’information pour le résumé automatique de documents
Mots clés
Résumé automatique, extraction d'information, traitement automatique des langues
Résumé
La forte augmentation de documents disponible en format numérique a fait ressortir la nécessité de concevoir des outils spécifiques pour accéder à l’information pertinente. Parmi ces outils on trouve les systèmes de résumé automatique. Le but du résumé automatique est de produire une version condensée du document source à l’aide de techniques informatiques. Ceci afin d’aider le lecteur à décider si le document en question contient l’information recherchée ou pas. Les techniques utilisées pour le résumé automatique sont inspirées de diverses orientations. En effet, plusieurs techniques ont été explorées en linguistique (basée sur l’analyse du discours et de sa structure) et en statistique (basée sur la distribution des occurrences des mots). Ces techniques peuvent être classées en deux grandes approches : par abstraction et par extraction. La première approche, par abstraction, vise à rédiger un résumé en générant des phrases pas forcément contenues dans le document original. La deuxième approche, par extraction, se limite à extraire des phrases complètes censées être les plus pertinentes du document et à les concaténer de façon à produire un extrait. Dans cette recherche, nous nous intéressons au couplage des méthodes statistiques et symboliques, afin d’améliorer les performances des méthodes basée sur l’extraction de l’information marquées par le manque de cohérence des résumés produits.
Statut
Vérifié