Gérer des données historiques détaillées : une solution ou une pollution ?
Michel Bruley
Quelques décennies après les premières déclarations de Mac Luhan sur l’âge électronique, force est de constater que pour une fois un « futurologue » avait attiré notre attention dans la bonne direction. Les nouvelles technologies de l’information et des communications ont en effet bouleversé notre façon de faire des affaires et notre vie privée. Aujourd’hui elles étendent nos pouvoirs et nous permettent d’échanger avec la terre entière, ou du moins avec ses parties connectées. Cependant des perspectives non prévues se dessinent : par exemple d’une part un monde virtuel voit le jour dans lequel l’information supplante l’expérience et d’autre part la masse d’informations qui nous arrive chaque jour prend de plus en plus la forme d’une inondation.
Un nouveau déluge a-t-il commencé ? Des cassandres nous prédisent que nous allons être submergés par un tel volume d’informations que nous n’arriverons plus à le traiter, à le canaliser et qu’il nous imposera une vérité incontrôlée. Ici les défis sont de savoir définir ce qui est de l’information et pas seulement des données, de savoir industrialiser le traitement des données pour livrer des éléments qui ont du sens, de savoir gérer les flux d’informations pour alimenter nos activités. Au-delà de la définition des besoins et des priorités, la question centrale est celle de l’architecture de la gestion des données. Faut-il un système d’information décisionnel à côté des systèmes opérationnels ? Vaut-il mieux des systèmes décisionnels spécialisés par fonction plutôt qu’un gisement commun ? Jusqu’à quel niveau de détail et sur quelle profondeur d’historique faut-il conserver les données ?
Les réponses à ces questions sont maintenant établies et expérimentées depuis quelques années, la gestion de données historiques détaillées doit être au cœur de toute solution. La pollution ne vient pas du volume des données mais de la perte de contrôle due à l’absence de réponse aux questions car l’historique est trop court, ou le niveau de détail insuffisant ou qu’il y a de multiples réponses à la question, émanant de systèmes différents gérant des vues différentes de la même réalité. Les meilleurs experts donnent sur ce sujet les principaux conseils suivants : utilisez uniquement la terminologie de votre entreprise de façon à ce que tout le monde puisse comprendre ; mettez toutes vos données dans un seul entrepôt, peu importe sa taille ; gérez les données au niveau le plus détaillé ; structurez vos données grâce un modèle d’entreprise ; facilitez l’accès direct aux données détaillées ; mesurez/mesurez/mesurez votre entrepôt de données (usage, adoption, temps de réponse, …etc).
Pour aller plus loin sur ce sujet vous pouvez utilement consulter mes articles ci-dessous :
De l'utilisation des données historiques
Un Data Warehouse d'entreprise pour tirer toute la valeur de son capital informationnel
Data Warehousing : la vérité... rien que la vérité
Un entrepôt de données central pour l'armée de l'air des Etats-Unis;
> A LIRE EN CE MOMENT SUR DECIDEO
-
En 2026, l’IA ne doit plus être accessoire mais bien une stratégie décisive
-
Protection des données : une question de processus
-
Privacy day : les données, c’est pas donné !
-
IA industrielle : sans données fiables, l’intelligence artificielle est inutile
-
Selon la quatrième étude de Precisely et LeBow, la confiance dans l'IA dépasse le niveau de préparation, alors que les lacunes en matière d'intégrité des données persistent
-
AÉSIO Mutuelle accélère son utilisation des données avec Qlik Cloud
-
IA interdites : quand l’usage devient risqué et inacceptable
-
Etude IBM : l’IA, moteur d’une croissance plus intelligente des entreprises en France d’ici 2030
-
ABBYY lance Vantage 3.0, intégrant directement l’IA générative et offrant des capacités avancées de conformité et de confidentialité
-
Sage Copilot place l’IA au cœur des ERP des PME industrielles et de la distribution