Afficher la notice abrégée
dc.contributor.author |
Touati Hamad, Zineb |
|
dc.date.accessioned |
2024-10-02T14:20:37Z |
|
dc.date.available |
2024-10-02T14:20:37Z |
|
dc.date.issued |
2024 |
|
dc.identifier.uri |
http//localhost:8080/jspui/handle/123456789/12036 |
|
dc.description.abstract |
Le domaine de l'analyse du contenu en ligne sensible évolue rapidement, représentant un vaste champ de recherche qui exige une attention considérable. Avec la prolifération du contenu numérique sur diverses plates-formes en ligne, les questions de l'authenticité et de l'intégrité sont devenues de plus en plus prégnantes. Ces facteurs soulignent le besoin critique d'efforts de recherche complets visant à évaluer et à améliorer les performances et l'efficacité des méthodes utilisées pour évaluer le contenu numérique, en particulier sous forme de texte numérique. Au milieu de la profusion de contenu numérique disponible sur Internet, le cas du Saint Coran constitue un point focal convaincant pour la recherche. Alors que les algorithmes dominent tous les aspects du contenu numérique, il est ironique de constater que le contenu coranique arabe reste largement sous-exploité en termes de linguistique informatique, en particulier avec l'émergence des algorithmes d'intelligence artificielle. Malheureusement, ce contenu manque de surveillance et est rarement égalé en sophistication. Il est extrêmement difficile, en particulier pour les non-arabophones, de distinguer et de vérifier l'authenticité des versets coraniques présentés dans des textes arabes non coraniques. Les techniques de traitement de texte classées en dehors du domaine du traitement du langage naturel (NLP) donnent des résultats moins efficaces, en particulier avec les textes arabes. Pour aborder les problèmes mentionnés, cette thèse présente différentes méthodes pour authentifier le contenu numérique sensible dans le but d'améliorer les étapes de recherche et de récupération. La première méthode repose sur l'identification des versets coraniques intégrés ou référencés dans les textes arabes, qui sont difficiles à distinguer du langage arabe non coranique. L'objectif est atteint en utilisant le Word Embeddings (WE) avec des techniques de Deep Learning (DL). Le travail proposé a été évalué en utilisant douze modèles différents d'incorporation de mots avec deux des classificateurs binaires courants, à savoir : le réseau neuronal convolutif (CNN) et la mémoire à long terme (LSTM). Les résultats expérimentaux ont montré que l'approche proposée surpasse les méthodes traditionnelles dans la distinction entre les versets coraniques et le texte arabe avec une précision de 98,33 %. Alors que les méthodes traditionnelles d'authentification se sont principalement concentrées sur les mots ou les phrases individuelles, l'authentification des versets coraniques et la préservation de leur ordre en tenant compte de la corrélation de la séquence des mots/versets représentent des aspects pivotaux qui nécessitent une attention spécialisée. Par conséquent, la deuxième méthode repose sur l'authentification des versets/citations spécifiques de la méthode précédente en termes de séquence de mots/versets. L'objectif est atteint en appliquant des algorithmes d'apprentissage profond pour vérifier automatiquement l'intégrité de l'ordre du contenu coranique. L'algorithme LSTM a été choisi pour ce travail, en raison de sa distinction par rapport aux autres réseaux dans le traitement des données séquentielles. Les résultats ont montré une précision de test de 99,98 % sur l'ensemble de données que nous avons créé en utilisant les données du site Tanzil. |
en_US |
dc.language.iso |
fr |
en_US |
dc.publisher |
Université Echahid Cheikh Larbi-Tebessi -Tébessa |
en_US |
dc.subject |
: Contenu en ligne sensible, Authentification du Coran, Identification du Coran, Intégrité du contenu, Deep Learning, Word Embeddings |
en_US |
dc.title |
Deep Learning pour un système d'intégrité et d'authentification des textes numériques du Saint Coran |
en_US |
dc.type |
Thesis |
en_US |
Fichier(s) constituant ce document
Ce document figure dans la(les) collection(s) suivante(s)
Afficher la notice abrégée