Entrepôt de données : revue de ce qu’il ne faut pas faire
Michel Bruley
Sans entrer dans la problématique du choix des fournisseurs, les lignes ci-dessous recensent sous forme de recommandations, les principales idées qui sont largement répandues et qu’il ne faut surtout pas suivre.
Pour réaliser votre entrepôt de données, ne consultez aucune personne extérieure à votre organisme. Votre cas est unique et seules des personnes de chez vous peuvent trouver la solution qui convient. Ne cherchez pas à savoir ce que font vos concurrents, ne regardez pas les références de fournisseurs de solutions décisionnelles.
Fixez-vous comme premier objectif de spécifier de façon exhaustive tous les besoins décisionnels de votre organisme, en particulier soignez particulièrement bien la définition détaillée des restitutions attendues.
Cherchez à satisfaire les utilisateurs en leur réalisant des systèmes personnels sur mesure. Concrètement il s’agit de multiplier les data marts dans une logique de construire pour chaque division, département voire service, des moyens totalement adaptés au périmètre de leur problématique, en particulier à leur vocabulaire, à leur façon de voir les données sans se soucier d’autre chose que de leur vision spécifique des affaires. À chacun sa vérité.
Planifiez de multiples projets décisionnels en parallèle, sans vous soucier de fixer des priorités ni de produire rapidement des résultats.
Évitez le plus possible de stocker des données détaillées et fondez les systèmes sur des données agrégées, des compteurs du type RFM, et faites une large place aux données d’enquêtes, d’études ponctuelles et d’informations qualitatives que les utilisateurs maîtrisent bien, voire produisent eux-mêmes.
Au niveau de la modélisation, bannissez la 3ème forme normale, fondez le plus possible les datamarts sur des modèles en étoile ou en flocon, de façon à optimiser au maximum les performances des requêtes qui sont envisagées au moment de la conception du système.
Pour les restitutions, simplifiez le plus possible la vie des utilisateurs en fournissant des résultats facilement compréhensibles comme des moyennes, des médianes ou des métriques synthétiques, qui permettent de suivre simplement des sujets complexes.
Pour faciliter l’appréciation des performances fondez exclusivement les suivis sur des comparaisons entre données de prévision et de réalisation, en veillant à ne pas trop multiplier les chiffres et à rester très synthétique, en particulier il convient de limiter la profondeur de l’historique des données.
Au niveau des moyens technologiques, privilégiez des solutions prêtes à l’emploi spécifiques, quitte à multiplier les fournisseurs et les moyens.
Défendez bec et ongles l’idée que la vérité est dans les statistiques.
Investissez un minimum dans votre entrepôt de données, gardez le plus possible votre argent au fond d’un coffre, il y sera en sécurité.
> A LIRE EN CE MOMENT SUR DECIDEO
-
Veeam renforce la confiance dans les données avec la nouvelle version de la Veeam Data Platform, présentée en avant-première au VeeamON (New York)
-
Un an après sa création, Myriade s'impose dans l'analytique IA des grandes entreprises
-
Scality s’impose comme l’acteur clé du stockage informatique des hôpitaux français
-
Podcast : Mauvaise gouvernance ? Faut-il empêcher ou interdire ?
-
SAP dévoile l’Entreprise Autonome
-
Celonis lance Context Model pour éliminer les angles morts opérationnels de l’IA d’entreprise et annonce l’acquisition d’Ikigai Labs, leader de l’intelligence décisionnelle alimentée par IA
-
Portworx by Everpure intègre nativement la gestion des données à Red Hat OpenShift
-
Cloudera lance un connecteur Workflow Data Fabric Zero Copy pour ServiceNow
-
La data comme actif stratégique : pourquoi 90 % des entreprises passent à côté
-
Rocket Software enrichit son offre avec l’acquisition de Vertica