Gérer des données historiques détaillées : une solution ou une pollution ?
Michel Bruley
Quelques décennies après les premières déclarations de Mac Luhan sur l’âge électronique, force est de constater que pour une fois un « futurologue » avait attiré notre attention dans la bonne direction. Les nouvelles technologies de l’information et des communications ont en effet bouleversé notre façon de faire des affaires et notre vie privée. Aujourd’hui elles étendent nos pouvoirs et nous permettent d’échanger avec la terre entière, ou du moins avec ses parties connectées. Cependant des perspectives non prévues se dessinent : par exemple d’une part un monde virtuel voit le jour dans lequel l’information supplante l’expérience et d’autre part la masse d’informations qui nous arrive chaque jour prend de plus en plus la forme d’une inondation.
Un nouveau déluge a-t-il commencé ? Des cassandres nous prédisent que nous allons être submergés par un tel volume d’informations que nous n’arriverons plus à le traiter, à le canaliser et qu’il nous imposera une vérité incontrôlée. Ici les défis sont de savoir définir ce qui est de l’information et pas seulement des données, de savoir industrialiser le traitement des données pour livrer des éléments qui ont du sens, de savoir gérer les flux d’informations pour alimenter nos activités. Au-delà de la définition des besoins et des priorités, la question centrale est celle de l’architecture de la gestion des données. Faut-il un système d’information décisionnel à côté des systèmes opérationnels ? Vaut-il mieux des systèmes décisionnels spécialisés par fonction plutôt qu’un gisement commun ? Jusqu’à quel niveau de détail et sur quelle profondeur d’historique faut-il conserver les données ?
Les réponses à ces questions sont maintenant établies et expérimentées depuis quelques années, la gestion de données historiques détaillées doit être au cœur de toute solution. La pollution ne vient pas du volume des données mais de la perte de contrôle due à l’absence de réponse aux questions car l’historique est trop court, ou le niveau de détail insuffisant ou qu’il y a de multiples réponses à la question, émanant de systèmes différents gérant des vues différentes de la même réalité. Les meilleurs experts donnent sur ce sujet les principaux conseils suivants : utilisez uniquement la terminologie de votre entreprise de façon à ce que tout le monde puisse comprendre ; mettez toutes vos données dans un seul entrepôt, peu importe sa taille ; gérez les données au niveau le plus détaillé ; structurez vos données grâce un modèle d’entreprise ; facilitez l’accès direct aux données détaillées ; mesurez/mesurez/mesurez votre entrepôt de données (usage, adoption, temps de réponse, …etc).
Pour aller plus loin sur ce sujet vous pouvez utilement consulter mes articles ci-dessous :
De l'utilisation des données historiques
Un Data Warehouse d'entreprise pour tirer toute la valeur de son capital informationnel
Data Warehousing : la vérité... rien que la vérité
Un entrepôt de données central pour l'armée de l'air des Etats-Unis;
> A LIRE EN CE MOMENT SUR DECIDEO
-
Selon une étude de Finextra et Cloudera, 91 % des institutions financières considèrent l’IA hybride comme fortement créatrice de valeur, en faisant la nouvelle norme du secteur
-
Informatica collabore avec Emirates Flight Catering pour mettre en place un service de restauration plus intelligent et axé sur les données
-
Celonis s'associe à Databricks pour optimiser une IA d'entreprise qui améliore en continu les opérations
-
Snowflake annonce de nouvelles innovations pour accélérer le développement d’applications d’IA agentique de niveau entreprise
-
Qualtrics fait évoluer sa gouvernance d’IA pour soutenir l'innovation sur mesure et les retours clients
-
SAP donne aux développeurs les moyens de piloter la révolution de l’IA des métiers
-
Infios et Amazon Web Services, Inc. (AWS) unissent leurs forces pour transformer l’exécution de la supply chain grâce à l’intelligence artificielle agentique
-
Une nouvelle étude révèle une accélération de la migration vers SAP S/4HANA, malgré les défis persistants liés à l'automatisation
-
Akeneo permet aux entreprises de proposer des expériences produits optimales grâce à des flux de données intelligents pilotés par l’IA
-
Netskope Threat Labs : l’industrie manufacturière autorise l’usage de l’IA pour réduire les risques liés à son utilisation incontrôlée