Un DataLake est un système de stockage qui conserve de grandes quantités de données brutes, qu'elles soient structurées, semi-structurées ou non structurées. Il permet aux entreprises de stocker des données de différentes sources, offrant ainsi une flexibilité maximale pour l'analyse (BI) et l'exploration des données à tout moment.
Une Database (base de donnée) est un système organisé de stockage d'informations structurées, généralement sous forme de tables, permettant un accès, une gestion et une manipulation efficaces des données. Les bases de données sont conçues pour garantir la cohérence, la sécurité et l'intégrité des données tout en permettant l'exploitation de ces dernières.
Chaque logiciel possède ses propres données stockées dans sa propre base de données, avec son propre système de classification, de nomenclature, etc. C'est pourquoi, avant de pouvoir créer des rapports et d'autres visualisations à partir de ces données, il est nécessaire de les harmoniser et de les rassembler dans un même environnement. Cela permet d'augmenter la productivité et l'efficacité, et nous permet de travailler avec des données cohérentes et harmonisées. Dans ce but, il est nécessaire de créer une infrastructure où toutes ces données harmonisées seront stockées. Mes différentes missions m'ont permis créer, mettre à jour et maintenir des datalakes.