Mémoires de Fin d’Etudes
Etablissement
Université de Laghouat - Amar Telidji
Affiliation
Département d’Informatique
Auteur
Amri, Leila
Directeur de thèse
Moussaoui Abdelouahab
Filière
Informatique
Diplôme
Magister
Titre
Data mining distribué : application à la détection de communautés dans les réseaux sociaux
Mots clés
classification dynamique,data minig distribué, détection de communautés, réseaux sociaux
Résumé
le datamining distribué (DDM : Distributed DataMining) se situe à la conjonction de deux évolutions majeures : d’une part, l’explosion de masses de données importantes et souvent réparties dont il faut savoir extraire une connaissance utile, d’autre part le développement sans précédent des réseaux d’ordinateurs permettant le raccordement de milliers d’ordinateurs comme c’est le cas des réseaux sociaux. Les réseaux représentent un outil puissant pour la compréhension de la dynamique, la robustesse et l’évolution des systèmes complexes (sociaux, biologiques, etc.). La détection de communautés occupe une grande importance dans divers domaines. En effet, l’identification de la structure communautaire des réseaux complexes contribue dans l’extraction des informations utiles permettant de les analyser et les comprendre. Ces informations concernent les éléments du réseau et les interactions entre eux. En effet, l’analyse structurale des réseaux complexes focalise son étude sur les relations entre ses éléments pour en extraire les informations sur les groupes (densité, cohésion, hiérarchie, équivalence, etc.) et les positions remarquables que les éléments peuvent occuper (périphérie, médiation, centralité, etc.). L’analyse des réseaux sociaux pose des problèmes difficiles, comme la modélisation des interactions "sociales", la fouille de données structurées (graphes, textes, données hétérogènes) et la prise en compte de l’évolution temporelle des réseaux. De plus, les applications génèrent souvent des volumes de données très importants, avec des graphes comptant plusieurs dizaines des millions de nœuds, ce qui pose de sérieuses restrictions sur les algorithmes utilisables. Dans cet exposé, nous présentons ce domaine de recherche et décrirons quelques problématiques et exemples pouvant intéresser les statisticiens. Plusieurs méthodes de détection de communautés ont été proposées pour identifier des structures communautaires efficaces. Cependant, la plupart de ces méthodes n’étaient pas appropriés aux réseaux complexes vu qu’elles présentent des limites non négligeables. Le but de ce sujet est justement de proposer une nouvelle approche de d’extraction de connaissances prenant en considération les propriétés des réseaux sociaux pour la détection de communauté dans ce type de réseaux.
Notes
Statut
Vérifié