Etablissement
Ecole Nationale Supérieure d'informatique
Affiliation
Département de Post-Graduation
Auteur
SADEG, Souhila
Directeur de thèse
BENATCHBA Karima (Professeur)
Co-directeur
HABBAS Zineb (Professeur)
Filière
Informatique
Diplôme
Doctorat
Titre
Synérgies entre optimisation combinatoire et data mining
Mots clés
Data mining, optimisation combinatoire, synérgies
Résumé
Le data mining (DM) est une discipline qui est apparue au milieu des années 1990. Elle est souvent décrite comme étant le cœur du processus de découverte (extraction) de connaissances KDD (Knowledge Discovery and Data mining). Son objectif est d’extraire et d’exploiter des connaissances potentiellement utiles et souvent cachées dans de grands volumes de données. Ce domaine connaît ces dernières années un engouement de la part de chercheurs de différents horizons et ce pour deux raisons :1) la constante croissance du volume de données à traiter, 2) la qualité de l’interprétation que permettent les analyses approfondies qu’offre le data mining en comparaison avec de simples résultats statistiques. Le Data-Mining est défini comme étant le processus de découverte de corrélations, de diagrammes et de tendances existant au sein d’une population (Fayyad et al, 1996). Il est constitué de quatre tâches principales : 1) la classification supervisée qui vise à expliquer ou classer des caractéristiques d’un individu donné suivant les valeurs prises par le reste des caractéristiques, 2) la classification non supervisée (également appelée clustering) qui a pour objectif de construire des groupes homogènes d’individus. Elle exprime les similarités découvertes à l’intérieur des groupes et les dissimilitudes entre les groupes, 3) Les règles d’association dont l’objectif est de découvrir des similitudes entre les individus, 4) la sélection d’attributs, qui peut être appliquée avant l’une des trois tâches précédentes afin de pallier au problème du grand nombre d’attributs en sélectionnant les attributs les plus pertinents. Les problèmes posés par le data-mining constituent des défis importants auxquelles s’attaquent plusieurs domaines de recherche tels que les statistiques, la théorie de l’information, les bases de données, l’apprentissage automatique mais aussi la recherche opérationnelle (Corne et. Al, 2012). En effet, beaucoup de travaux utilisant des méthodes de recherche opérationnelle (RO), et plus particulièrement les métaheuristiques, pour résoudre des problèmes de data mining ont été publiés (Karasozen et. al., 2009 ; Olafsson, 2006 ; Olafsson et. al., 2008). Cependant, nous voyons ces dernières années se profiler une nouvelle tendance qui consiste à utiliser les tâches du data-mining pour aider les métaheuristiques dans leur résolution de problèmes NP-Difficile. De récents articles parlent d’ailleurs de « synergies » pour désigner la bilatéralité de la relation entre ces deux disciplines (Corne et al, 2012 ; Meisel et Mattfeld, 2010). Il est clair que cette coopération entre les deux domaines est moins étudiée dans ce sens que dans le premier. C’est un axe de recherche qui émerge et qui exploite les techniques du data-mining pour renforcer les stratégies de recherches des différentes métaheuristqiues (Jourdan et al., 2005). Travail demandé : Dans ce travail, nous allons nous intéresser à la synergie entre la recherche opérationnelle et le data-mining. Pour cela, les travaux de cette thèse se diviseront en deux parties, chacune s’intéressant à l’un des deux sens de coopération entre ces deux domaines. Dans la première partie, une étude sera menée sur l’apport de la RO au DM en focalisant sur l’utilisation des métaheuristiques dans différentes tâches du data mining. Un choix se portera sur une ou plusieurs métaheuristiques, en particulier, qui seront appliquée à différentes tâches. La seconde partie s’articulera autour de l’apport du Data mining au métaheuristiques. Ce sens étant le moins étudié, car le plus récent, fera l’objet de la principale contribution de cette thèse. Il s’agira d’étudier les différents niveaux d’intégration des techniques du DM aux métaheuristiques. En effet, les techniques du data mining peuvent être intégrées à une métaheuristique pour différentes raisons : Accélérer le processus de recherche, améliorer la qualité des résultats obtenus, ajuster ses paramètres…etc.
Statut
Vérifié