Entrepôt de données : revue de ce qu’il ne faut pas faire
Michel Bruley
Sans entrer dans la problématique du choix des fournisseurs, les lignes ci-dessous recensent sous forme de recommandations, les principales idées qui sont largement répandues et qu’il ne faut surtout pas suivre.
Pour réaliser votre entrepôt de données, ne consultez aucune personne extérieure à votre organisme. Votre cas est unique et seules des personnes de chez vous peuvent trouver la solution qui convient. Ne cherchez pas à savoir ce que font vos concurrents, ne regardez pas les références de fournisseurs de solutions décisionnelles.
Fixez-vous comme premier objectif de spécifier de façon exhaustive tous les besoins décisionnels de votre organisme, en particulier soignez particulièrement bien la définition détaillée des restitutions attendues.
Cherchez à satisfaire les utilisateurs en leur réalisant des systèmes personnels sur mesure. Concrètement il s’agit de multiplier les data marts dans une logique de construire pour chaque division, département voire service, des moyens totalement adaptés au périmètre de leur problématique, en particulier à leur vocabulaire, à leur façon de voir les données sans se soucier d’autre chose que de leur vision spécifique des affaires. À chacun sa vérité.
Planifiez de multiples projets décisionnels en parallèle, sans vous soucier de fixer des priorités ni de produire rapidement des résultats.
Évitez le plus possible de stocker des données détaillées et fondez les systèmes sur des données agrégées, des compteurs du type RFM, et faites une large place aux données d’enquêtes, d’études ponctuelles et d’informations qualitatives que les utilisateurs maîtrisent bien, voire produisent eux-mêmes.
Au niveau de la modélisation, bannissez la 3ème forme normale, fondez le plus possible les datamarts sur des modèles en étoile ou en flocon, de façon à optimiser au maximum les performances des requêtes qui sont envisagées au moment de la conception du système.
Pour les restitutions, simplifiez le plus possible la vie des utilisateurs en fournissant des résultats facilement compréhensibles comme des moyennes, des médianes ou des métriques synthétiques, qui permettent de suivre simplement des sujets complexes.
Pour faciliter l’appréciation des performances fondez exclusivement les suivis sur des comparaisons entre données de prévision et de réalisation, en veillant à ne pas trop multiplier les chiffres et à rester très synthétique, en particulier il convient de limiter la profondeur de l’historique des données.
Au niveau des moyens technologiques, privilégiez des solutions prêtes à l’emploi spécifiques, quitte à multiplier les fournisseurs et les moyens.
Défendez bec et ongles l’idée que la vérité est dans les statistiques.
Investissez un minimum dans votre entrepôt de données, gardez le plus possible votre argent au fond d’un coffre, il y sera en sécurité.
> A LIRE EN CE MOMENT SUR DECIDEO
-
Tableau démocratise l'analytique en entreprise en s'appuyant sur de nouvelles fonctionnalités à base d'IA générative
-
Salesforce annonce la disponibilité d’Einstein Copilot avec de nouvelles fonctionnalités pour booster les ventes
-
Vincent Cornillet prend la direction du Centre d’Entraînement et de Développement de l’Intelligence Artificielle (CEDIA) de Preligens
-
Teradata adopte Iceberg et Delta Lake pour offrir à ses clients le meilleur écosystème ouvert et connecté pour une IA de confiance
-
Podcast : Quel appareil pour embarquer demain l’intelligence artificielle au plus près de notre corps ?
-
DigDash accompagne France Travail dans le déploiement d’outils de Business Intelligence pour le pilotage opérationnel et stratégique
-
Gouvernance des données : neuf professionnels des services financiers sur dix demandent des réglementations et des normes en matière d'IA
-
L’AIOps, une nouvelle ère pour le stockage des données
-
Tableau et Databricks aident les entreprises à partager, connecter et visualiser leurs données
-
Claranet et Cloudera lancent une plateforme de gestion de données intégrée à un cloud souverain français sécurisé et conforme