Résumé:
La notion de big data est un concept s’étant popularisé en 2012 pour traduire le fait que les entreprises sont confrontées à des volumes de données (data) à traiter de plus en plus considérables et présentant un fort enjeu commercial et marketing ,de nouvelles techniques ont été proposées pour améliorer le stockage et le traitement de ces données massives, comme le projet Hadoop, Ces données ne peuvent être traiter avec gestion de base de données classique c’est pour ça que sont nées les bases de données NoSQL (Not Only SQL)
Le Data Warehouse, ou entrepôt de données, est une base de données dédiée au stockage de l'ensemble des données issues depuis les bases de production. Il est alimenté en données grâce notamment aux outils d »extraction, transformation et chargement connu sous le terme processus ETL ( Extract Transform Load ).
Nous avons travaillé sur la conception d’une architecture modélise le processus ETL basé MapReduce, ainsi, nous avons présenté une implémentation du notre architecture.