Résumé:
Grâce aux progrès des technologies numériques, la préservation et la
valorisation de notre patrimoine documentaire est devenue un enjeu majeur mais,
par la suite, elle a posé des difficultés d’accès à l’information et à son organisation.
L’analyse des documents peut apporter une solution, mais les méthodes classiques
ne sont pas suffisamment souples pour s’adapter à la variabilité rencontrée. Pour
palier à ce problème, nous proposons comme objectif : la catégorisation
automatique des textes manuscrits arabes, par une technique d’appariement
approximatif des chaînes de caractères, pour contourner les difficultés des
méthodes de classification classiques basées sur l’apprentissage. Afin de contribuer
à la sauvegarde et à la valorisation de l’énorme héritage culturel constitué de
milliers d’ouvrages et de documents manuscrits anciens dont nous disposons.