Big Data, Science des données, aide à la décision en entreprise, business intelligence, data warehouse, reporting, OLAP, web analytics, data visualization, data mining, internet des objets, informatique cognitive, intelligence artificielle...

Abonnez-vous gratuitement à Decideo !


Decideo

 


Cap sur la gestion de la qualité des données


Rédigé par le 27 Avril 2010

Toutes les entreprises ont des problèmes de qualité de données. Les mesures standard de la qualité des données sont la validité, la précision et l’exhaustivité. Mais la qualité des données comprend également toutes les caractéristiques permettant aux données de répondre à l’usage que l’on a prévu d’en faire. Et plus particulièrement leur accessibilité, leur fraîcheur et leur cohérence.



Michel Bruley, Directeur Marketing & PR Teradata Europe de l’Ouest
Michel Bruley, Directeur Marketing & PR Teradata Europe de l’Ouest
Grâce au développement de la Business Intelligence et à la mise en œuvre d’entrepôts de données pour aider à la prise de décisions, les sociétés accèdent à une vision détaillée de l’information sur l’ensemble de l’entreprise. Par exemple dans le secteur des Assurances, les données clients sont reliées aux données sur les produits, les souscriptions, les primes et les sinistres. La valeur de l’information se multiplie à mesure que s’ajoutent de nouvelles dimensions. Malheureusement, l’impact des erreurs se multiplie également. Il est fréquent que ceux qui utilisent les données ne soient pas vraiment sûrs de leur signification, ou qu’ils les utilisent à des fins autres que celles prévues.

Les entreprises installent un entrepôt de données pour avoir accès à toutes les informations dont elles ont besoin pour prendre de meilleures décisions. L’accès s’est amélioré, mais sans référence ni mesures adéquates, nombre d’entre elles sont déçues de constater qu’elles ont maintenant un meilleur accès à des volumes plus importants… de données de mauvaise qualité.


La qualité des données n’est pas simplement une question de précision ; elle doit également fournir une meilleure représentation et un historique de la façon dont chaque donnée est obtenue ou calculée. Ces « données sur les données » s’appellent les métadonnées. Malheureusement, la plupart des entreprises stockent leurs méta données un peu partout, sur des documents, des tableaux, des post-it ou dans la mémoire d’un employé. Savoir où se trouve l’information et la mettre à la disposition de tous ceux qui en ont besoin n’est pas aisé. Un bon répertoire de métadonnées permet aux informaticiens de gérer efficacement l’entrepôt de données. Il permet d’identifier les doublons (les données sont-elles déjà présentes ailleurs ?), les données interdépendantes (cette donnée sert-elle à en obtenir d’autres ; que se passera-t-il si elle est modifiée ?) et le taux d’utilisation des données (est-elle souvent utilisée ?). Il permet en outre aux utilisateurs de comprendre les règles afférentes aux données. Ceci inclue la validité des codes et des conditions d’utilisation, ainsi que toute information complémentaire à propos des données présentes dans l’entrepôt, comme par exemple à qui appartient cette donnée et quand est elle mise à jour.

Pour résoudre les problèmes de qualité des données et mieux profiter d’une vision d’ensemble des données de l’entreprise, de nombreuses sociétés mettent en place une équipe de gestion de la qualité des données. L’équipe de gestion de la qualité des données a pour objectif de permettre une bonne exploitation des informations-clés d’une société. Cette équipe multifonctionnelle réunit des représentants de chaque ligne d’activités et de chaque fonction de l’entreprise. Ils sont chargés de gérer les données et les informations pour l’ensemble de la société. Des représentants des services informatiques fournissent support et conseils à l’organisation sur de nombreux points, et plus particulièrement ceux liés à l’utilisation des outils d’infrastructure.

L’objectif de l’équipe de gestion de la qualité des données est de développer des règles communes et une terminologie cohérente qui seront utilisées dans les différents secteurs d’activité et dans l’ensemble de la société. Une équipe de gestion de la qualité permet de surpasser les « demandes » conflictuelles de chaque unité et de promouvoir la mise en place d’une version unique de la vérité. Cette équipe de gestion de la qualité des données est composée de plusieurs profils.

Le sponsor est un cadre supérieur à qui a été délégué la gestion de la qualité des données. À mesure que les travaux de l’équipe de la gestion de la qualité des données avancent, il est nécessaire d’initier des changements de processus et de politique. Cette organisation, par le biais de son sponsor, doit disposer de l’autorité indispensable à la mise en œuvre de ces changements qui visent à améliorer la qualité et l’utilité des données en fonction des besoins.

Les propriétaires de données sont les unités fonctionnelles qui ont demandé la constitution de gisement de données historiques. Le propriétaire prépare les exigences métier et définit les règles qui seront associées aux données.

Les gestionnaires de données gèrent les besoins d’information sur un ensemble d’unités, en gardant à l’esprit les objectifs globaux de l’entreprise. Les informations créées par différents départements concernent divers domaines. Les données sont reliées les unes aux autres, et chaque problématique commune est résolue par décision consensuelle.

Le gardien des données est posté dans le secteur informatique, il doit s’assurer qu’elles sont collectées et traitées sur la chaîne d’information selon les spécifications développées par le propriétaire. L’informatique est responsable du nettoyage, de l’accessibilité et de la protection des données. Ceci comprend la sauvegarde et la récupération ainsi que l’accès sécurisé aux données.

De nombreux clients Teradata ont pu expérimenter que quand les pilotes et les outils appropriés sont en place, l’information peut être exploitée dans l’ensemble de l’entreprise, et cette dernière met le cap sur la rentabilité.

Pour aller plus loin sur le sujet vous pouvez utilement consulter les liens ci-dessous :

Data-Warehouses-and-Quality-Not-Just-for-IT-Anymore
http://www.teradata.com/t/white-papers/Data-Warehouses-and-Quality-Not-Just-for-IT-Anymore-eb5499/?type=WP

Gouvernance du Système d’Information Décisionnel
http://www.decideo.fr/bruley/Gouvernance-du-Systeme-d-Information-Decisionnel_a13.html




Nouveau commentaire :
Facebook Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.