Gérer des données historiques détaillées : une solution ou une pollution ?
Michel Bruley
Quelques décennies après les premières déclarations de Mac Luhan sur l’âge électronique, force est de constater que pour une fois un « futurologue » avait attiré notre attention dans la bonne direction. Les nouvelles technologies de l’information et des communications ont en effet bouleversé notre façon de faire des affaires et notre vie privée. Aujourd’hui elles étendent nos pouvoirs et nous permettent d’échanger avec la terre entière, ou du moins avec ses parties connectées. Cependant des perspectives non prévues se dessinent : par exemple d’une part un monde virtuel voit le jour dans lequel l’information supplante l’expérience et d’autre part la masse d’informations qui nous arrive chaque jour prend de plus en plus la forme d’une inondation.
Un nouveau déluge a-t-il commencé ? Des cassandres nous prédisent que nous allons être submergés par un tel volume d’informations que nous n’arriverons plus à le traiter, à le canaliser et qu’il nous imposera une vérité incontrôlée. Ici les défis sont de savoir définir ce qui est de l’information et pas seulement des données, de savoir industrialiser le traitement des données pour livrer des éléments qui ont du sens, de savoir gérer les flux d’informations pour alimenter nos activités. Au-delà de la définition des besoins et des priorités, la question centrale est celle de l’architecture de la gestion des données. Faut-il un système d’information décisionnel à côté des systèmes opérationnels ? Vaut-il mieux des systèmes décisionnels spécialisés par fonction plutôt qu’un gisement commun ? Jusqu’à quel niveau de détail et sur quelle profondeur d’historique faut-il conserver les données ?
Les réponses à ces questions sont maintenant établies et expérimentées depuis quelques années, la gestion de données historiques détaillées doit être au cœur de toute solution. La pollution ne vient pas du volume des données mais de la perte de contrôle due à l’absence de réponse aux questions car l’historique est trop court, ou le niveau de détail insuffisant ou qu’il y a de multiples réponses à la question, émanant de systèmes différents gérant des vues différentes de la même réalité. Les meilleurs experts donnent sur ce sujet les principaux conseils suivants : utilisez uniquement la terminologie de votre entreprise de façon à ce que tout le monde puisse comprendre ; mettez toutes vos données dans un seul entrepôt, peu importe sa taille ; gérez les données au niveau le plus détaillé ; structurez vos données grâce un modèle d’entreprise ; facilitez l’accès direct aux données détaillées ; mesurez/mesurez/mesurez votre entrepôt de données (usage, adoption, temps de réponse, …etc).
Pour aller plus loin sur ce sujet vous pouvez utilement consulter mes articles ci-dessous :
De l'utilisation des données historiques
Un Data Warehouse d'entreprise pour tirer toute la valeur de son capital informationnel
Data Warehousing : la vérité... rien que la vérité
Un entrepôt de données central pour l'armée de l'air des Etats-Unis;
> A LIRE EN CE MOMENT SUR DECIDEO
-
La donnée comme dernier rempart contre l’accident industriel
-
Le ministère des Armées et des Anciens combattants notifie un accord-cadre à Mistral AI pour renforcer la souveraineté technologique de la défense
-
Mines Paris – PSL annonce la création d’un nouveau centre de recherche pour l’avenir des données spatiales : Le Centre de Statistique et Images (STIM)
-
Snowflake annonce son intention d'acquérir Observe pour accélérer l’observabilité pilotée par l'IA à l'échelle de l'entreprise
-
Snowflake intègre Gemini 3 de Google à Snowflake Cortex AI pour faciliter le déploiement de l’IA en entreprise
-
Cornerstone obtient la certification ISO 42001, norme mondiale pour une IA éthique et responsable
-
Cloud computing : un choix technologique devenu un choix d’avenir
-
Tendances 2026 de Red Hat : Open source et cloud hybride au cœur de la transformation IT française
-
HexaDone acquiert Hyvilo pour créer le leader français de la gestion des données des acteurs territoriaux
-
La compétence en IA la plus importante sur laquelle se concentrer en 2026 : le middle management