Mémoires de Fin d’Etudes
Etablissement
Université de Tlemcen - Abou Bekr Belkaid
Affiliation
Département d’informatique
Auteur
El Habib Daho, Mostafa
Directeur de thèse
Chikh Mohamed Amine (Professeur)
Co-directeur
Pierre Geurts (Professeur)
Filière
Intelligence Artificielle et Génie Logiciels
Diplôme
Doctorat
Titre
Classification des données médicales et biologiques par les méthodes d’ensembles.
Mots clés
Méthodes d’ensembles, Forêts Aléatoires, Extra trees, classification, donnés médicales, données biologiques.
Résumé
La biologie est un domaine scientifique qui reste encore très incomplet au sens où la somme de connaissances et informations qui nous reste à découvrir est non négligeable. Il est fréquent que les approches classiques de statistiques soient inadaptées à la complexité du problème traité. Certaines d’entre elles produisent des résultats peu fiables. C’est pourquoi ces techniques peinent parfois à apporter des réponses aux nombreuses questions biologiques non résolues. Notre tâche ici est non seulement d’analyser efficacement les masses de données produites par les expériences à haut débit et d’en extraire une connaissance fiable mais aussi d’élaborer des modèles de systèmes biologiques à des prédictions utiles. La recherche de gènes de maladie est un problème où une approche dite intelligente peut s’avérer nécessaire. Par ailleurs, la recherche des gènes consiste à déterminer les gènes qui sont à l’origine des maladies d’une large population dans la société. Ce sujet de thèse comporte principalement trois étapes, la première concerne la préparation d’une base de données biologique, la deuxième étape porte sur une recherche bibliographique étendue sur le domaine. Dans la dernière étape nous appliquons des méthodes ensemblistes pour la reconnaissance et la classification des données biologiques et médicales.
Statut
Signalé