Résumé:
Le graphe de connaissances (GC) joue un rôle crucial dans de nombreuses applications modernes.En effet, l'extraction automatisée d'informations à partir du texte et sa transformation en une description formelle est un objectif important à la fois dans la recherche sur le Web sémantique et la linguistique informatique. Les informations extraites peuvent être utilisées pour une variété de tâches telles que la génération du graphe de connaissance. DBpedia extrait des informations structurées de Wikipédia, les relie à d'autres bases de connaissances et publie librement les résultats sur le Web à l'aide de Linked Data et de SPARQL.Dans ce contexte, nous présentons dans ce mémoire une étude pourl'enrichissement des résultats de l'extracteur de Dbpedia.Dans ce travail, nous avons concentré sur l’enrichissement de l'extraction des connaissances depuis les infobox de Wikipédia. Dans ce cadre, nous avons présenté principalement une contribution pourl'utilisation de la mesure de similarité pour l'enrichissement des résultats de l'extracteur de Dbpedia. L’approche proposée comporte deux étapes: le prétraitement des triples RDF et ensuite le calcule de similarité. L’approche est implémentée en utilisant Eclipse Java et plusieurs API comme JENA pour manipuler les graphes RDF.