Mémoires de Fin d’Etudes
Etablissement
Université 8 mai 1945 de Guelma
Affiliation
Département d’Informatique
Auteur
Aouine, Mohammed
Directeur de thèse
Mr Hamid SERIDI (Professeur)
Filière
Intelligence Artificielle et Génie Logiciels
Diplôme
Magister
Titre
CATEGORISATION AUTOMATIQUE DE TEXTE ARABE
Mots clés
Traitement automatique de la langue arabe, Catégorisation automatique, Apprentissage automatique.
Résumé
Devant l’augmentation énorme du volume de documents arabe sur Internet, e-mail, l’intranet des entreprises et les bibliothèques numériques, l’accès aux données d’une façon précise et rapide devient très difficile. La catégorisation manuelle des textes dans ce cas est très difficile même s’il est possible elle infect l’efficacité, la rapidité et le coût. Pour cela il est donc nécessaire de développer des programmes de catégorisation automatique. Cet article propose une méthode de catégorisation des textes arabes en utilisant les Support Vector Machine (SVM) qui est basée sur l’apprentissage automatique. Un prétraitement linguistique et statistique est effectué afin d’adapter les techniques SVM aux texte arabe, ensuite un model de catégorisation est générer à partir d’un processus d’apprentissage automatique avec SVM .
Date de soutenance
2009
Cote
004
Pagination
79 pages
Illusatration
relieure
Format
PDF
Statut
Traitée