Big Data, Science des données, aide à la décision en entreprise, business intelligence, data warehouse, reporting, OLAP, web analytics, data visualization, data mining, internet des objets, informatique cognitive, intelligence artificielle...

Abonnez-vous gratuitement à Decideo !


Decideo

 


Faire son Data Mining directement dans son Entrepôt de Données !?


Rédigé par Michel Bruley - Teradata France le 8 Juillet 2004



Michel Bruley
Michel Bruley
Le Data Mining est une puissante technique d'analyse qui par exemple permet à des responsables d'entreprises d'aller plus loin que la simple description des comportements passés d'une clientèle et de prédire l'avenir. Il permet de déceler dans les comportements « mystérieux » des clients des règles qui les sous-tendent. Grâce à ces découvertes, il est possible d'augmenter les revenus, de réduire les dépenses, d'identifier des opportunités commerciales et donc de bénéficier d'avantages concurrentiels certains.

Mais à en croire certains fournisseurs de solutions et de prestations de data mining, il serait indispensable de disposer d'outils dédiés (base de données, data mart ou serveur analytique) pour faire du data mining. Ils invoquent pour cela la nécessité d'extraire les données sous un format propriétaire pour réaliser des traitements efficaces. Or, non seulement ces moyens spécialisés sont onéreux à mettre en place et à maintenir, mais ils exigent que les données soient extraites pour chaque projet distinct de data mining, ce qui représente une procédure coûteuse et fortement consommatrice de temps. Heureusement, les progrès réalisés dans le domaine des bases de données n'exigent plus d'effectuer le data mining dans des data marts distincts. En réalité, pour une opération de data mining efficace, il suffit de s'appuyer sur son entrepôt de données, ce qui, au regard du coût d'investissement total, se révèle considérablement moins cher que d'utiliser des moyens spécifiques.

Au fur et à mesure que les sociétés mettent en place des EDW (Enterprise Data Warehouse, entrepôt de données d'entreprise) et couvrent l'ensemble des besoins décisionnels des différentes divisions et fonctions de l'entreprise, le nombre d'utilisateurs exploitant des modèles de data mining ne cesse de croître. En effet un EDW bien architecturé ne se contente pas de stocker efficacement l'ensemble des données historiques, il rend inutiles d'autres data marts ou d'autres moyens spécialisés de stockage. Un EDW constitue la fondation idéale pour des projets de data mining, en fournissant un répertoire de données unique à l'échelle de l'entreprise, capable d'offrir une vision cohérente et actualisée des activités. En outre, l'intégration de fonctionnalités de data mining au sein de l'EDW permet à l'entreprise de réaliser deux types d'économies supplémentaires. Tout d'abord, il n'est plus nécessaire d'acheter et d'assurer la maintenance de matériel complémentaire uniquement dédié au data mining ; ensuite les entreprises ne sont plus obligées d'effectuer un va-et-vient de données depuis et vers l'entrepôt pour réaliser les projets de data mining, ce qui, nous l'avons vu plus haut, est une opération gourmande en temps et en ressources.

A titre d'exemple, l'un des plus grands opérateurs de téléphonie mobile aux USA utilise aujourd'hui un EDW Teradata pour fournir des informations à une large gamme d'applications commerciales et marketing. Cet opérateur, desservant de nombreux marchés régionaux, avait été conduit à établir différents data marts régionaux, et obtenir une vue d'ensemble des informations à l'échelle de l'entreprise était devenu particulièrement difficile. Les prises de décision souffraient de l'absence de données ou d'informations cohérentes, ce qui affectait les performances et le moral des équipes qui ne pouvaient pas anticiper et mesurer le fruit de leur travail.
En transférant toutes ses données vers un EDW, cet opérateur a pu constater des résultats immédiats. Les données étaient mises en cohérence, les décisions pouvaient être prises en toute sécurité, avec l'assurance que les données reposaient sur des fondations saines. En termes d'efficacité, le nouvel EDW délivre des informations d'une meilleure qualité 90% plus vite qu'avec l'ancienne approche par data marts. Lorsqu'il est nécessaire d'analyser de grandes quantités de données, de tels gains permettent de faire la différence sur le marché.

Vous pouvez utilement consulter les liens suivants :
Pour faire un tour d'horizon du domaine du Data Mining http://www.aiaccess.net
Pour approfondir le fait que le Data Mining ne nécessite pas une base de données distincte et dédiée
http://www.teradata.com/t/go.aspx/?id=44097




Nouveau commentaire :
Facebook Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.