Mémoires de Fin d’Etudes
Etablissement
Université de Tlemcen - Abou Bekr Belkaid
Affiliation
Département d’informatique
Auteur
Maatallah, Houcine
Directeur de thèse
BELALEM Ghalem (Professeur)
Co-directeur
BOUAMRANE Karim (Professeur)
Filière
Informatique
Diplôme
Doctorat
Titre
Vers un nouveau modèle de stockage et d‘accès aux données dans les Big Data et les Cloud Computing
Mots clés
Cloud Computing, BigData, NoSQL, YCSB, Hadoop, HDFS, MapReduce, Métadonnées
Résumé
La révolution technologique intégrant de multiples sources d’informations, la vulgarisation de l’informatique dans les différents secteurs et domaines ont amené à l’explosion de la volumétrie des données, qui reflète le changement d’échelle des volumes, nombres et types. Ces accroissements massifs ont poussé à l’évolution des manières de gestion, de stockage, de localisation et d’accès aux données. Les dernières étapes de cette évolution informatique ont émergé de nouvelles technologies : Cloud Computing et BigData. Le Big Data est un ensemble de technologies basées sur les bases de données NoSQL « Not Only SQL » permettant le passage à grande échelle en volumes, en nombres et en types de données. Les grandes entreprises du domaine informatique voient dans les nouveaux systèmes NoSQL, de nouvelles solutions permettant de répondre à leurs besoins d’évolutivité. Plusieurs solutions open-source et payantes de modèles NoSQL sont disponibles sur le marché. Dans la première contribution, nous développons une étude comparative sur les performances de six solutions NoSQL très répandues dans le marché, à savoir : MongoDB, CouchBase, Cassandra, HBase, Redis, OrientDB à l’aide du Benchmark YCSB. La finalité est d’apporter l’assistance et l’aide nécessaire aux acteurs intéressés de Big Data et de Cloud Computing pour d’éventuelles prises de décision sur le choix de la meilleure solution appropriée pour leurs entreprises. Notre deuxième contribution consiste à proposer des remaniements internes dans l’architecture de l’implantation de référence des Clouds de stockage et de Big Data, à savoir HDFS d’Hadoop. HDFS adopte un service de métadonnées séparé aux données avec isolation et centralisation des métadonnées par rapport aux serveurs de stockage de données. Nous proposons une approche qui permet d’améliorer le service de métadonnées d’HDFS en employant un parallélisme modéré des métadonnées, entre centralisation et distribution des métadonnées, afin d’accentuer la performance et l’extensibilité du modèle.
Réponse CS
validé
Statut
Validé