Please use this identifier to cite or link to this item:
http//localhost:8080/jspui/handle/123456789/1860
Title: | Machine Learning pour un Système d’Authentification des versets du saint coran online |
Authors: | Bouagal, Asma |
Keywords: | Classification des textes, Langue arabe, Coran, TASHKEEL, Diacritiques, Word Tokenizer. Text classification, Arabic language, Koran, TASHKEEL, Diacritics, Word Tokenizer تصنيف النص ، اللغة العربية ، القرآن ، التشكيل ، التشكيل ، رمز الكلمات. |
Issue Date: | 2020 |
Publisher: | Universite laarbi tebessi tebessa |
Abstract: | Notre travail décrit un système de classification des textes arabes et coranique en fonction des similarités. Nous avons utilisé des techniques d’apprentissage automatique dans lesquelles nous avons appliqué de nombreux filtres et classificateurs. Les meilleurs résultats ont été obtenus en utilisant l'algorithme LSTM (Long Short-Term Memory), avec une exactitude de l’ordre de 86,67%, une perte de 21,27%, cela sans enlever le TASHKEEL. Et avec le TASHKEEL ont obtient une exactitude de l’ordre de 100%, une perte de 17,8%. Nous avons observé que les diacritiques peuvent avoir un impact négatif sur l’exactitude et la perte s’ils sont utilisés avec la technique de "Word Tokenizer" dans la phase de prétraitement |
URI: | http//localhost:8080/jspui/handle/123456789/1860 |
Appears in Collections: | 3- إعلام آلي |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Mémoire_Imp.pdf | 6,36 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
Admin Tools