Résumé:
Les méthodes de réseaux de neurones artificiels, en particulier l'apprentissage en profondeur, ont réalisé d’importants succès dans le domaine de la vision par ordinateur.
Ce projet de fin d’étude propose un système d’identification de script vidéo basé sur une méthode d’apprentissage en profondeur appelée réseau de neurones convolutifs qui réussissent dans diverses applications d’identification d’images. Les évaluations ont été effectuées sur la base de données appelées CSVI 2015 soumise lors de la compétition ICDAR 2015.
Le réseau de neurones convolutifs peut être présenté avec différentes architectures pour atteindre l'objectif d'apprentissage. Dans notre travail, nous avons proposé une architecture composée d'un ensemble de couches convolutives, de couches ReLu, de couches de max pooling et de couches entièrement connectées.
Nous démontrons de manière expérimentale que la précision peuvent être augmentés lors de l’utilisation optimale des paramètres dans la même architecture du réseau de neurones convolutifs et par la modification de l’architecture du CNN