Mémoires de Fin d’Etudes
Etablissement
Université de Béjaia - Abderrahmane Mira
Affiliation
Département d’Informatique
Auteur
HOUARI, Rima
Directeur de thèse
Mohand Tahar KECHADI (Professeur)
Filière
Informatique
Diplôme
Doctorat
Titre
Etude de Génération d’Echantillons Multidimensionnels pour le Data Mining
Mots clés
Data mining, systèmes intelligents, techniques d’échantillonnage, échantillon multidimensionnel.
Résumé
Récemment, les capacités de stockage sont en progression quasi exponentielles. En effet, nous récoltons plus de données que nous pouvons en traiter. Les données accumulées sont souvent brutes et loin d’être de bonne qualité ; elles contiennent des valeurs manquantes, du bruit, et surtout des informations redondantes. La présence des valeurs manquantes et la redondance de l’information au niveau des dimensions (attributs) sont des inconvénients bien souvent insurmontables pour la plupart des algorithmes de data mining. Intuitivement, l’information pertinente est noyée dans de nombreux attributs, que son extraction n’est possible que si les données originales sont nettoyées et prétraitées. Pour remédier à ce problème et aussi au problème de très grandes tailles des données, nous proposons une nouvelle technique de pré-traitement de données qui vise à éliminer les valeurs manquantes, les bruits, et les attributs redondants et aussi de réduire leur taille en générant des échantillons représentatifs et de qualités.
Statut
Vérifié