Decideo - Actualités sur le Big Data, Business Intelligence, Data Science, Data Mining

Abonnez-vous gratuitement à Decideo !


Decideo

 


Miser sur la gestion globale des données pour mener à bien la transformation numérique


Rédigé par Dinesh Chandrasekhar, Hortonworks le 21 Mai 2018

Voilà 20 ans environ que la question de la transformation numérique occupe les esprits. Mais aujourd’hui, les entreprises de différents secteurs de l’industrie se lancent effectivement dans plusieurs initiatives de transformation numérique. La plupart de ces initiatives visent à optimiser l’expérience client, à stimuler l’efficacité opérationnelle des activités commerciales ou encore à créer un impact positif sur les résultats financiers.



Mais le combustible de ces initiatives réside essentiellement dans les données ! Malgré les efforts pour regrouper toutes les données pertinentes dans un datalake ou quelque chose de similaire, les entreprises constatent que leurs données existent toujours dans leurs magasins de données sur site, ou dans le cloud, voire à la source, comme dans les fils d’information des réseaux sociaux, les séquences de clics sur le parcours de navigation et les dispositifs connectés en périphérie. La difficulté consiste à superviser l’ensemble de ces sources de données mais aussi à gérer, gouverner, sécuriser et analyser ces données comme le permettent les solutions Global Data Management (GDM) de gestion globale des données. Une entreprise dotée d’une stratégie GDM solide peut mieux réussir ses projets de transformation numérique.

Malgré les avancées révolutionnaires des outils de stockage et de gestion des données, nous entendons toujours les entreprises confrontées aux mêmes problèmes de volumétrie, de vélocité et de variété. Lors d’un évènement récent, j’ai eu l’occasion de discuter avec un visiteur de ces difficultés. Celui-ci travaille dans une grande entreprise de traitement des paiements (dont il n’a pas révélé le nom) qui exécute plus d’un milliard de transactions par jour. Ils utilisent pour le moment un entrepôt de données tournant sur une célèbre base de données relationnelle. Un outil de reporting produit des tableaux de bord à partir de l’entrepôt de données. Mais cette configuration se confronte à une évolutivité limitée en plus de coûter cher en gestion et en développement. Ils envisagent donc d’investir dans une solution Big Data capable d’absorber leurs besoins de stockage croissants et d’évoluer. Ils estiment également qu’un bon moteur de traitement de flux combiné avec une solution analytique de streaming permettrait de supporter la rapidité des transactions pour produire de l’intelligence décisionnelle. Pour le moment, le challenge ne porte que sur les données structurées. Ils ne savent pas encore comment gérer leurs données non structurées mais ils considèrent à raison qu’une solution Big Data les y aidera également.

Il est important de noter dans l’exemple pré-cité que même si une architecture de données moderne optimisée par des solutions Big Data permet de répondre aux besoins immédiats de cette entreprise, celle-ci doit quand même élaborer une stratégie GDM pour les raisons suivantes :

1. Etablissement de catalogue de données fondé sur des métadonnées : il convient de considérer toutes les données connexes des magasins de données au repos ainsi que les flux de données en transit. Par exemple, si vous lancez une initiative Customer 360, vous devez avoir accès aux données des clients dans votre CRM basé dans le cloud, dans vos systèmes hérités, dans votre DBMS opérationnel, dans vos flux sociaux, dans vos clics de navigation, dans les données de vos succursales, etc. Il vous faut une vision unique pour accéder à de tels insights. Les fournisseurs commencent à proposer des solutions de classement à l’aide de métadonnées pour de tels actifs. Les catalogues de données et les concepts similaires de virtualisation des données vont bientôt se généraliser.

2. Gestion du cycle de vie des données : il s’agit de pouvoir exécuter des fonctions de gestion du cycle de vie des données sur des sources de données diverses. Celles-ci incluent sans s’y limiter les fonctions de sauvegarde/restauration des données, de reprise après incident, etc.

3. Gouvernance et sécurité des données : il convient de gouverner et sécuriser toutes les données provenant de multiples sources de données. La gouvernance des données est une thématique importante pour les données au repos et celles en transit. Toutes les données qui entrent dans l’entreprise subissent une série de transformations pour les besoins de qualité des données, d’enrichissement des données ou d’augmentation pour les convertir dans un autre format pour un usage ultérieur. Mais nous vivons dans un monde de conformité et de réglementations. Prenez, par exemple, le RGPD : il est important que les entreprises comprennent qui a accès à quelles données, qui les a modifiées, quand, etc. Ce degré de sécurité, de contrôle et de responsabilité est nécessaire et peut être atteint via une solide solution GDM.

4. Intelligence des données : une fois qu’il est possible de visualiser facilement de multiples sources de données, l’étape suivante est celle de la valorisation des données. Combinez toute la puissance des insights historiques émanant de vos données au repos et des insights périssables de vos données en transit pour produire de l’intelligence décisionnelle, optimisée par l’identification de modèles, le traitement d’événements complexes ou CEP (complex event processing) et les modèles de Machine Learning.

Prévoyez les utilisations futures en plus des utilisations actuelles

Les analystes évoquent la nécessité d’un entrepôt de données logique ou LDW (logical data warehouse) ou d’une topologie de données capable d’interroger toutes vos sources de données. Cela revient à la vision unique telle que décrite précédemment. Actuellement, concernant le LDW, l’accent est mis sur l’accès des données et leur analyse. Toutefois, j’encourage les entreprises à voir plus loin et à considérer une stratégie GDM adaptée ainsi qu’à prévoir les autres fonctions de gestion des données potentiellement utiles pour soutenir leurs initiatives digitales. 80 % de l'analyse des données est effectuée sur seulement 20 % des données que possède l’entreprise. Plutôt que de s’inquiéter de la valeur potentielle des données restées dans l’obscurité, il est plus pertinent de se focaliser sur les points de données les plus critiques et pertinentes afin de pouvoir prendre les décisions les plus stratégiques au bon moment.

La gestion des données représente un défi, elle inclut la gestion de plusieurs clouds, l’obtention d’une vue unique de la sécurité et de la gouvernance, et la gestion de toutes les données, de tous types et où qu’elles résident. Ceci suppose de concevoir une architecture tournée vers l’avenir de façon à éviter tout risque de verrouillage propriétaire. A cet égard, nombre d’entreprises du classement Fortune 1000 font confiance aux technologies open source. C’est l’assurance d’une grande liberté de choix des outils ou plateformes mais aussi de ne pas risquer d’être contraint sur la durée par un fournisseur lambda.

Alors, lancez-vous, choisissez bien vos initiatives de transformation numérique et menez cette transformation en toute confiance. Mais assurez-vous au préalable d’avoir défini une bonne stratégie GDM et de choisir une solution GDM qui répondra à vos besoins pour assurer la réussite de vos initiatives digitales.




Nouveau commentaire :
Facebook Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.