Abstract:
Big Data est un phénomène omniprésent dans la vie quotidienne. Il comporte les données qui sont générées tout le temps via différentes manières humaines, matérielles et logicielles. Ces données multidimensionnelles sont caractérisées par le volume dramatiquement élevé, la variété aussi bien en termes de source que de format, ainsi que la vélocité qui traduit la vitesse extraordinaire de leur génération et la nécessité de les stocker et les traiter dans un temps raisonnable. A cause de son implication croissante dans différents domaines et différentes applications de tout genre, Big Data ne cesse d’engendrer, jour après jour, de multiples défis qui nécessitent une considération pour être traités. La visualisation des données présente un axe important de ces défis. Elle consiste à présenter les données graphiquement afin de faciliter aux utilisateurs le processus d’exploration, de recherche et d’analyse. Cependant, malgré la multitude des techniques et des outils de visualisation, les dimensions de Big Data, connues sous le terme : 3Vs, rendent le processus de visualisation difficile à réaliser sans avoir recours à des méthodes modernes pour supporter ces dimensions.
Cette thèse vise à traiter le problème de visualisation des données en considérant deux volets, à savoir la visualisation des données et l’analytique visuelle. Le premier volet vise à améliorer la visualisation des données volumineuses et massives tout en considérant la satisfaction des contraintes de visualisation, notamment l’interactivité, la mise en échelle et la dynamique des données. Le second volet a pour objectif de considérer l’aspect de préférences de visualisation. Cet aspect, largement répandu au sein de la communauté scientifique, s’intéresse à l’amélioration de l’expérience utilisateur pour permettre à ce dernier d’explorer et/ou d’analyser graphiquement les données massives d’une manière consistante selon ses intérêts et orientations.
Dans le premier volet, deux approches ont été proposées dont une permet de préparer les grands data-sets à la visualisation interactive structurée et l’autre offre une méthode de visualiser les graphes à grande échelle d’une manière effective tout en assurant la mise en échelle et la personnalisation. Ces deux approches ont montré une consistance en termes d’effectivité, de rapidité et de faible complexité. Dans le second volet, une approche proposée consiste à assimiler le problème de visualisation exploratoire comme un problème de recommandation. Cela permet de considérer l’aspect de préférences des utilisateurs afin de leur recommander les données qui sont susceptibles de les intéresser et sous les formes graphiques qui leur sont adéquates. Cette approche, basée sur la régression, a montré, elle aussi, une performance remarquable face aux métriques d’évaluation, à savoir la perte, MSE, MAE et R-carré.