Mémoires de Fin d’Etudes
Etablissement
Université d’Oran1 - Ahmed Ben Bella
Affiliation
Département d’Informatique
Auteur
KENNICHE, Ahlem
Directeur de thèse
BELDJILALI Bouziane (Professeur)
Co-directeur
ZEKRI L.
Filière
Informatique:Programmation et Systéme
Diplôme
Magister
Titre
Indexation de Données à Large Echelle
Mots clés
Systèmes pair à pair hybrides; Gnutella 0.6; Percolation; Seuil de satisfaction; SVD; Cluster; Méthode sémantique de localisation.
Résumé
Le Pair à pair (p2p) a permis une décentralisation des systèmes, en permettant à tous les ordinateurs de jouer le rôle de client (il peut effectuer des requêtes) et de serveur (il répond aux requêtes). Un tel système n’est composé que des machines des utilisateurs du système et n’implique pas de coût lié à des serveurs. Nous proposons dans cette thèse deux méthodes de routage des requêtes dans les systèmes pair à pair. Nous nous intéressons tout particulièrement à l’architecture hybride. La première méthode fait usage de la théorie de la percolation, qui permet le calcul d’un seuil critique, que nous appelons seuil de satisfaction. Celui-ci permet aux ultrapairs une prise de décision intelligente dans le processus de routage au lieu de l’utilisation automatique du nombre de sauts (Time To Live: TTL) qu’effectue la requête. Ce seuil permet d’alléger la fonctionnalité des ultrapairs car il représente la satisfaction du nœud demandeur de la requête par les réponses de ses voisins. Il est calculé en prenant en compte le nombre de réponses retournées par chaque voisin touché, par rapport au nombre de mots de la requête émise. La deuxième méthode de routage proposée est une méthode sémantique pour la localisation de fichiers. Nous composons une matrice particulière dite mot-mot, qui capture les occurrences des mots. Cette matrice sert à déduire les pairs qui parlent le même langage et de router les requêtes vers eux. Nous appliquons sur cette matrice une méthode spectrale appelée décomposition à valeur singulière (Singular Value Décomposition : SVD). Cette méthode nous permet d’interroger les individus les plus susceptibles d’avoir les fichiers recherchés et de créer des clusters de mots et des clusters de pairs, et ainsi d’optimiser la recherche. La particularité de notre méthode est l’application de la SVD sur une matrice mot_mot symétrique à diagonale fortement dominante.
Date de soutenance
2011
Cote
TH3511
Pagination
157F.
Illusatration
ILL. EN COUL
Format
30 cm
Notes
RESUME ET MOTS CLES EN FRANCAIS. ANNEXE 139-143F.BIBLIOG.144-157F.RESUME ET MOTS CLES EN ANGLAIS.
Statut
Soutenue