Etablissement
Ecole Nationale Supérieure d'informatique
Affiliation
Département de Post-Graduation
Auteur
MADANI, Amina
Directeur de thèse
Omar Boussaid (Professeur)
Co-directeur
Zegour Djamel Eddine (Professeur)
Filière
Informatique
Diplôme
Doctorat
Titre
Fouille dans les documents semi-structurés
Mots clés
documents semi-structurés, fouille de données, text mining, classification, clustering
Résumé
Les documents semi-structurés et plus particulièrement XML sont devenus de plus en plus répandus. Ces derniers utilisent un langage permettant généralement de décrire les données et faciliter ainsi leurs transferts. D’autres langages, tels que RDF (et RDF/S), OWL, ..., sont utilisés pour décrire des informations sémantiques, des ontologies… Cet intérêt porté sur les documents XML peut être étendu à d’autres documents,notamment les documents RDF ou OWL. Cependant, les problèmes à aborder seront différents. Les documents RDF par exemple décrivent des informations sémantiques. Le recours aux techniques de la recherche d’informations peut s’avérer intéressant à explorer. De même, les documents OWL qui représentent des ontologies posent d’autres problèmes. L’objectif de ce travail de recherche est, dans un premier temps, d’identifier les verrous scientifiques liés aux différents types de documents semi-structurés et de classifier les problèmes respectifs. Il s’agit ensuite de construire des solutions en combinant différentes approches pour définir des nouvelles techniques efficaces de fouille dans les documents semi-structurés.
Statut
Vérifié