Decideo - Actualités sur le Big Data, Business Intelligence, Data Science

Abonnez-vous gratuitement à Decideo !


Decideo


 
Glossaire / Lexique
Rechercher :
Alimentation (Outil d') (ETL) :
L’outil d’alimentation est un élément essentiel d’une architecture décisionnelle. Peu valorisé, pas forcément très visuel, l’outil d’intégration de données est la porte d’entrée du système décisionnel; le « sas » devrait-on d’ailleurs plutôt dire; car il a une vocation de contrôle et d’admission des données propres dans l’entrepôt de données (voir ce terme). On en parle parfois de manière un peu négative comme de la tuyauterie du système; mais une tuyauterie indispensable sans laquelle aucun tableau de bord ne pourrait être publié.

L’acronyme anglais parle d’ETL pour Extraction - Transformation - Loading; soit Extraction - Transformation - Chargement; qui sont les trois étapes qu’il prend en charge.
L’extraction consiste à aller chercher dans les sources de données les informations nécessaires, à transférer dans l’entrepôt de données.
La transformation consiste à vérifier les données, les harmoniser, afin qu’elles puissent ensuite être comparées dans l’entrepôt de données.
Le chargement est la dernière phase, de stockage des données extraites et transformées, dans l’entrepôt de données de destination.

Avec le temps, et l’évolution des offres, l’outil d’alimentation à connu plusieurs changements :
- Certains ont proposé de faire de l’ELT; dans ce cas, la phase de transformation n’est plus faite par l’outil d’alimentation, mais dans la base de données de destination.
- Alimentation, Intégration, Hub… la terminologie a évolué, le plus souvent pour créer une différentiation marketing entre les éditeurs; mais la fonction reste la même.

Porte d’entrée du système décisionnel, l’outil d’intégration / alimentation a également un rôle clef à jouer dans :
- l’alimentation de la base des données de référence (Master Data Management - MDM) (voir ce terme)
- la création des métadonnées (voir ce terme)
- le respect des règles de sécurité, et de gouvernance des données

Sa fonction la plus importante est certainement celle de la vérification de la qualité des données. Tous les éditeurs de logiciels d’intégration ont développé des modules de vérification de la qualité des données (voir ce terme), plus ou moins performants. Cela peut aller jusqu’à de l’apprentissage machine (voir ce terme) pour automatiser la détection de données potentiellement erronées.
Voir aussi : Architecture d'un système décisionnel, Change Data Capture, ETL, Entrepôt de données (Data Warehouse), Qualité des données (Data Quality)