Etablissement
Ecole Nationale Supérieure d'informatique
Affiliation
Département de Post-Graduation
Auteur
BERKANI, Nabila
Directeur de thèse
Ladjel Bellatreche (Professeur)
Filière
Informatique
Diplôme
Magister
Titre
Construction d'un Entrepôt de Données Sémantique : Du processus ETL au Déploiement
Mots clés
Conception des entrepôt de données, Ontologie, Source de données sémantiques, Processus ETL.
Résumé
La prise de décision présente un processus décisif sur lequel peut reposer le futur de l'organisation. Les entrepôts de données (ED) sont des technologies incontournables pour les systèmes décisionnels. De ce fait, leur conception et développement ont fait l'objet de recherches actives ces dernières années. Actuellement, il est reconnu que la construction d’un entrepôt de données nécessite la conception de deux phases essentielles: la conception multidimensionnelle (MD) de l’ED cible, et la conception des processus ETL qui l’alimentent à partir de sources de données. De nos jours, la construction de modèles conceptuels MD et d’ETL est sujette à des erreurs, dues à un processus manuel qui subit plusieurs cycles de réconciliations et de retro-conception, jusqu'à ce que les besoins de l'entreprise soient satisfaits. Il est essentiel pour l'activité de l'entreprise de faciliter, d'accélérer et d'automatiser ces processus de conception. Les ontologies constituent un moyen élégant permettant l’automatisation du processus de conception et d’intégration sémantique des données. Aujourd’hui, les ontologies sont utilisées dans un nombre croissant d’applications ce qui a contribué à la génération de grandes quantités de données sémantiques difficiles à gérer en mémoire centrale. Les solutions persistantes ont été proposées comme une alternative pour assurer l'évolutivité de ces applications. En conséquence, un nouveau type de base de données est né, appelé base de données à base ontologique (BDBO). Différentes BDBOs ont été proposée par les deux communautés industrielle et de recherche. Elles différent principalement dans l’architecture et le modèle de stockage utilisés. Face à cette situation, les bases de données sémantiques sont devenues de réelles candidates pour les projets d’entreposage. Cependant, nous remarquons qu’aucune méthode n’a considéré ces BDBOs dans la construction des EDs. Aussi, l’étude des différentes méthodes et approches de conception d’un ED et des processus ETL qui l’alimentent, nous a permis de conclure que la plupart de ces méthodes étudient séparément les différentes étapes du cycle de vie en traitant la modélisation multidimensionnelle (MD) indépendamment des problématiques d’intégration et de chargement des données (ETL). De ce fait, nous proposons une méthode conjointe de conception et d’ETL pour la construction d’un entrepôt de données sémantique à partir de sources de données représentées par des bases de données à base ontologiques (BDBOs). Notre méthode, définie au niveau ontologique, permet la dérivation automatique des transformations ETL indépendamment de toute contrainte d’implémentation. Nous présentons une solution de déploiement de l’ED à la Carte, selon différents modèles de stockage (vertical, binaire et horizontal), en utilisant le pattern de conception DAO (Data Access Object). Notre méthode est validée sur le système de gestion de bases de données sémantiques: Oracle, avec des données issues du banc d'essai Lehigh University Benchmark (LUBM). Nous proposons également un prototype d’outil qui accompagne notre méthode.
Statut
Vérifié