Etablissement
Ecole Nationale Supérieure d'informatique
Affiliation
Département de Post-Graduation
Auteur
SOUALAH, Mohamed Ourabah
Directeur de thèse
GUESSOUM Abderrezak (Professeur)
Co-directeur
AIT ALI YAHIA Yassine (Docteur)
Filière
Informatique
Diplôme
Doctorat
Titre
Catalogage adaptatif des manuscrits arabes anciens numérisés par extraction de métadonnées par analyse d'images
Mots clés
Manuscrits arabes anciens; numérisation, catalogage; annotation, traitement d'images
Résumé
Trois millions de manuscrits arabes à travers le monde demeurent dans leur majorité méconnus par une communauté de chercheurs de plus en plus nombreux à s'y intéresser à ces œuvres. De plus, la consultation des manuscrits pose des problèmes d'ordre technique et d'ordre géographique. En effet, il n'est pas aisé de consulter un manuscrit à cause de sa fragilité et de l'éloignement des pays de leur conservation et dont certains d'entre eux se trouvent en état de guerre. Par conséquent, la numérisation et la mise en ligne des manuscrits se proposent comme une solution salutaire, qui permet d'une part, à une large population de consulter les manuscrits et d'autre part, d'éviter la manipulation de l'œuvre originale. Toutefois, la numérisation pose à son tour un sérieux problème d'accès aux manuscrits. En effet, le mode image ne permet pas une recherche plein texte dans le contenu du manuscrit. A cet effet, la transcription diplomatique du manuscrit peut être envisagée. Malheureusement, la mise en œuvre d'une telle solution demande beaucoup de ressources humaines et temporelles. Il est donc, intéressant de rechercher un moyen d'accès aux manuscrits numérisés moins contraignant et plus adapté. Ainsi, le catalogage des manuscrits constitue un moyen d'accès très efficace. Pour ce faire, la détermination de métadonnées descriptives des manuscrits arabes permet de décrire d'une manière succincte le manuscrit selon ses divers aspects codicologique, paléographique et son histoire. Le catalogage des manuscrits arabes est une opération fastidieuse et difficile. Par conséquent, l'idée est d'effectuer un pré-catalogage, simple en se basant sur des métadonnées élémentaires, mettre en ligne les manuscrits numérisés et enfin, effectuer un catalogage final en ligne du manuscrit. La réalisation de cet objectif nécessite d'effectuer les tâches suivantes : - Rechercher des métadonnées nécessaires au catalogage des manuscrits arabes. - Rechercher des outils d'extraction automatique à partir d'image de manuscrits (Reconnaissance de caractères, Word Spotting, …) - Proposer un modèle pragmatique d'accès aux manuscrits arabes anciens numérisés basé sur des concepts sémantiques basé sur un système de données liées.
Statut
Vérifié