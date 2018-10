Depuis quelques décennies déjà, l’intégration de données s’impose comme un besoin incontournable des sociétés possédant un système d’information. Les usages des données intégrées restent multiples. S’il est difficile de dresser une liste exhaustive, quatre grandes familles de besoins semblent néanmoins former un noyau dur :

• la synchronisation des données,

• l’alimentation de bases décisionnelles (Datawarehouse et Datamart),

• les échanges de données inter applicatifs,

• la gestion de la qualité de données.

L’évolution rapide des habitudes, des technologies et des pratiques de ces dernières années ont imposé de nouveaux challenges. La demande en data toujours plus volumineuse se fait de plus en plus pressante, et les attentes (exigences), emportées par un enthousiasme grandissant, ne souffrent plus la moindre patience ; les traitements, bien que fluctuants, se doivent désormais d’être quasi instantanés...

Alors que les données étaient auparavant toutes dans des réseaux internes aux sociétés, elles se propagent désormais à l’extérieur du réseau d’entreprise, notamment grâces aux applications SaaS. La volumétrie a quant à elle poussé les sociétés à utiliser des bases de données du Cloud afin de permettre et maitriser la répartition de charge entre plusieurs serveurs. Enfin, les traitements ont eux aussi évolués. L’omniprésence des data-lakes qui mettent à dispositions des données hétérogènes et volumineuses a entraîné l’utilisation de serveurs distribués Hadoop (type EMR) pour s’assurer du bon fonctionnement des traitements tout en garantissant les meilleures performances.