Quelle infrastructure pour faire du data mining ?
Michel Bruley
Le Data Mining est une puissante technique d'analyse qui par exemple permet à des responsables d'entreprises d’aller plus loin que la simple description des comportements passés d'une clientèle et de prédire l'avenir. Il permet de déceler dans les comportements « mystérieux » des clients des règles qui les sous-tendent. Grâce à ces découvertes, il est possible d'augmenter les revenus, de réduire les dépenses, d'identifier des opportunités commerciales et donc de bénéficier d'avantages concurrentiels certains.
Mais à en croire certains fournisseurs de solutions et de prestations de data mining, il serait indispensable de disposer d'outils dédiés (base de données, data mart ou serveur analytique) pour faire du data mining. Ils invoquent pour cela la nécessité d'extraire les données sous un format propriétaire pour réaliser des traitements efficaces. Or, non seulement ces moyens spécialisés sont onéreux à mettre en place et à maintenir, mais ils exigent que les données soient extraites pour chaque projet distinct de data mining, ce qui représente une procédure coûteuse et fortement consommatrice de temps. Heureusement, les progrès réalisés dans le domaine des bases de données n'exigent plus d'effectuer le data mining dans des data marts distincts. En réalité, pour une opération de data mining efficace, il suffit de s’appuyer sur son entrepôt de données, ce qui, au regard du coût d'investissement total, se révèle considérablement moins cher que d'utiliser des moyens spécifiques.
Au fur et à mesure que les sociétés mettent en place des EDW (Enterprise Data Warehouse, entrepôt de données d'entreprise) et couvrent l'ensemble des besoins décisionnels des différentes divisions et fonctions de l’entreprise, le nombre d'utilisateurs exploitant des modèles de data mining ne cesse de croître. En effet un EDW bien architecturé ne se contente pas de stocker efficacement l'ensemble des données historiques, il rend inutiles d'autres data marts ou d'autres moyens spécialisés de stockage. Un EDW constitue la fondation idéale pour des projets de data mining, en fournissant un répertoire de données unique à l'échelle de l'entreprise, capable d'offrir une vision cohérente et actualisée des activités. En outre, l'intégration de fonctionnalités de data mining au sein de l’EDW permet à l'entreprise de réaliser deux types d'économies supplémentaires. Tout d'abord, il n'est plus nécessaire d'acheter et d'assurer la maintenance de matériel complémentaire uniquement dédié au data mining ; ensuite les entreprises ne sont plus obligées d’effectuer un va-et-vient de données depuis et vers l'entrepôt pour réaliser les projets de data mining, ce qui, nous l'avons vu plus haut, est une opération gourmande en temps et en ressources.
À titre d’exemple, l'un des plus grands opérateurs de téléphonie mobile aux USA utilise aujourd’hui un EDW pour fournir des informations à une large gamme d'applications commerciales et marketing. Cet opérateur, desservant de nombreux marchés régionaux, avait été conduit à établir différents data marts régionaux, et obtenir une vue d’ensemble des informations à l'échelle de l'entreprise était devenu particulièrement difficile. Les prises de décision souffraient de l’absence de données ou d’informations cohérentes, ce qui affectait les performances et le moral des équipes qui ne pouvaient pas anticiper et mesurer le fruit de leur travail. En transférant toutes ses données vers un EDW, cet opérateur a pu constater des résultats immédiats. Les données étaient mises en cohérence, les décisions pouvaient être prises en toute sécurité, avec l'assurance que les données reposaient sur des fondations saines. En termes d’efficacité, le nouvel EDW délivre des informations d’une meilleure qualité 90% plus vite qu'avec l'ancienne approche par data marts. Lorsqu’il est nécessaire d’analyser de grandes quantités de données, de tels gains permettent de faire la différence sur le marché.
> A LIRE EN CE MOMENT SUR DECIDEO
-
Selon une étude de Finextra et Cloudera, 91 % des institutions financières considèrent l’IA hybride comme fortement créatrice de valeur, en faisant la nouvelle norme du secteur
-
Informatica collabore avec Emirates Flight Catering pour mettre en place un service de restauration plus intelligent et axé sur les données
-
Celonis s'associe à Databricks pour optimiser une IA d'entreprise qui améliore en continu les opérations
-
Snowflake annonce de nouvelles innovations pour accélérer le développement d’applications d’IA agentique de niveau entreprise
-
Qualtrics fait évoluer sa gouvernance d’IA pour soutenir l'innovation sur mesure et les retours clients
-
SAP donne aux développeurs les moyens de piloter la révolution de l’IA des métiers
-
Infios et Amazon Web Services, Inc. (AWS) unissent leurs forces pour transformer l’exécution de la supply chain grâce à l’intelligence artificielle agentique
-
Une nouvelle étude révèle une accélération de la migration vers SAP S/4HANA, malgré les défis persistants liés à l'automatisation
-
Akeneo permet aux entreprises de proposer des expériences produits optimales grâce à des flux de données intelligents pilotés par l’IA
-
Netskope Threat Labs : l’industrie manufacturière autorise l’usage de l’IA pour réduire les risques liés à son utilisation incontrôlée