Mémoires de Fin d’Etudes
Etablissement
Université de Sétif 1 - Ferhat Abbas
Affiliation
Département d’Informatique
Auteur
HELASSA, Madiha
Directeur de thèse
MOUSSAOUI.Abdelouaheb. (Maitre de conférence)
Co-directeur
TOUAHRIA.Mohamed. (Maitre de conférence)
Filière
Informatique
Diplôme
Magister
Titre
Extraction de connaissances à partir de données : application au hadith
Mots clés
Fouille de données, Extraction de connaissances, Hadith, Corpus hadith.
Résumé
Cette thèse se focalise sur deux problématiques clés liées à la fouille de texte, à savoir : la classification et l’acquisition des connaissances. En dépit de leur relative maturité, ces deux problématiques présentent encore certains défis majeurs qui doivent être soulevés. En premier lieu, pour la classification automatique, un défi bien connu et non résolu consiste à effectuer des classifications avec un minimum de paramètres en entrée ; cette recherche a pour but d’étudier les nouvelles méthodes de classification des connaissances dans les bases de données textuelles telles que celles des Traditions Prophétiques (Hadith) En deuxième lieu, pour l’acquisition des connaissances, nous nous sommes intéressés à des problématiques importantes liées à la construction d’ontologies à partir de texte : en particulier a partir du corpus des Traditions Prophétiques (Hadith). Nous proposons ainsi, un nouveau cadre pour l’apprentissage d’ontologies à partir du texte. Notre proposition est une approche hybride qui combine les avantages suivants par rapport aux autres approches :(1) la capacité de capturer avec plus de flexibilité des relations dans le texte, (2) des concepts qui traduisent mieux le contexte du corpus considéré, (3) des décisions plus fiables prises durant le processus d’apprentissage à travers la considération et l’inclusion de plusieurs relations sémantiques, et, enfin, (4) l’évolution de l’ontologie apprise sans aucun effort manuel considérable, après son inclusion au coeur d’un système de recherche d’information
Date de soutenance
2012
Cote
TH853
Pagination
123P
Format
CD
Statut
Soutenue