Decideo - Actualités sur le Big Data, Business Intelligence, Data Science

Abonnez-vous gratuitement à Decideo !


Decideo


 
Glossaire / Lexique
Rechercher :
Mise à jour incrémentale (Change Data Capture) :
Il existe deux méthodes principales pour mettre à jour des données : supprimer les données précédentes et les remplacer; ou mettre à jour uniquement à partir ses nouvelles données et des données modifiées.
Historiquement les architectures de type « infocentre » étaient basées sur la méthode « annuler et remplacer ». Les bases de données, ou fichiers de production, étaient copiés à l’identique de leur environnement d’exécution vers l’environnement décisionnel. A chaque mise à jour (quotidienne, hebdomadaire, mensuelle…) la copie du système décisionnel était écrasée et remplacée par la nouvelle copie du système de production. Un choix forcément simple à mettre en oeuvre, mais pas du tout optimisé; aucun moyen non plus de suivre les évolutions du contenu.
Le principe de la mise à jour incrémentale (Change Data Capture), consiste à identifier les différences entre l’état N de la base décisionnelle, et l’état N+1 de la base de production. Ces différences peuvent être des données supprimées, des données modifiées et des données ajoutées.
Une fois ces différences identifiées, plutôt que de tout réécrire, on mettra à jour la base de données décisionnelles des seules modifications. La base décisionnelle N+1 sera bien alors dans le même état que la base de production N+1.
Cette mise à jour peut être cadencée, et peut être automatisée, afin de refléter de manière proche du temps réel, toutes les modifications de la base de production dans le système décisionnel. Cette réplication automatique n’est cependant pas recommandée dans tous les domaines ou pour toutes les applications; la prise de décision nécessite souvent un certain recul, et une « photographie temporelle » que des changements en temps réel ne permettent pas.
La mise à jour incrémentale permet partiellement la traçabilité (voir ce terme) des modifications apportées aux données de production. Cette traçabilité peut être activée au niveau le plus fin, de chaque donnée, de chaque enregistrement, dans certaines applications comme la détection de fraude, ou la lutte contre le blanchiment des capitaux.
La mise à jour incrémentale est prise en charge par les outils d’intégration / alimentation de type ETL (voir ce terme).
Voir aussi : Change Data Capture