Big Data, Science des données, aide à la décision en entreprise, business intelligence, data warehouse, reporting, OLAP, web analytics, data visualization, data mining, internet des objets, informatique cognitive, intelligence artificielle...

Abonnez-vous gratuitement à Decideo !


Decideo

 


Le datamining descriptif


Rédigé par Didier GAULTIER, Coheris le 10 Janvier 2012

Même si elle est assez répandue, l’expression « marketing prédictif » est assez restrictive car les meilleurs usages en marketing B2C comme B2B tirent souvent partie de ce qu’on peut appeler le « datamining descriptif ». Le descriptif comprend le fait de réaliser des enquêtes, des sondages, des analyses descriptives des bases de données marketing, des segmentations, avec toutes les interprétations des comportements des clients et des consommateurs qui suivront.



Didier Gaultier, Directeur Business Unit Datamining de Coheris
Didier Gaultier, Directeur Business Unit Datamining de Coheris
Aujourd’hui, la vie des gens est devenue beaucoup plus dense, plus active, et de ce fait plus complexe. De très nombreuses opportunités de services sont apparues dans à peu près tous les domaines. Les besoins en matière de « services à la personne » par exemple ont littéralement explosés au cours des dernières années. De même, en B2B, des besoins spécifiques à chaque métier sont aussi apparus.

Les comportements d’achat se sont par conséquent beaucoup diversifiés, eux-aussi. Nous parlions auparavant de la ménagère de moins de 50 ans. C’était un cliché. Mais de nos jours, c’est un cliché qui n’a plus aucune réalité. Dans beaucoup de secteurs, le facteur homme/femme par exemple n’est plus souvent, à l’exception près des produits cosmétiques ou spécialisés, un critère suffisamment fort, pour se permettre de différencier à lui seul les messages marketing alors que cela pouvait être le cas dans le passé.

Cette évolution n’a pas été sans conséquence dans le monde du datamining. La réalité s’est complexifiée et il a fallu s’adapter. De nombreux critères qui paraissaient être forts, comme la CSP (catégorie socio-professionnelle), l’âge ou le sexe, qui étaient ceux principalement employés en ciblage marketing, ne peuvent plus être utilisés tels quels aujourd’hui. Vous ne pouvez plus le faire non seulement parfois pour des raisons éthiques, mais surtout parce que cela n’a souvent plus aucun sens ! Un couple avec des revenus modestes peut, par exemple, être amené à faire des dépenses importantes, même si cela veut dire s’endetter fortement, parce que cela correspond à une nécessité à ce moment là. Ces comportements ponctuels en fonction de l’étape de la vie ne correspondent parfois pas au comportement-type « cliché » traditionnellement attendu.

Il devient donc de plus en plus difficile en marketing de faire jouer seulement l’intuition. Un marketeur a besoin de repères dans toutes ces données à sa disposition. C’est justement le rôle du datamining descriptif de construire une véritable « carte » des bases de données disponibles.

Pour prendre une analogie, navigueriez vous en bateau en plein océan sans avoir une bonne carte pour vous orienter ? Aujourd’hui, la même question se pose avec toutes les bases de données marketing qui sont à la disposition de l’annonceur. Il suffit d’en citer quelques unes pour s’en convaincre : base de données CRM, base de données transactionnelle, plateforme e-commerce, webanalytics, base venant de call centers, base de données email, SMS, etc. chacune de ces bases (qu’elles soient interconnectées ou pas) peut représenter une vision différente - mais surtout complémentaire - sur les mêmes clients.

Votre carte, c’est précisément le datamining descriptif - et lui seul - qui vous l’apporte. En ce sens, vous ne pourrez pas faire de prédictif, si vous n’avez pas fait un bon descriptif avant. C’est une des règles du datamining qui a parfois du mal à être admise par les annonceurs : cela revient à dire qu’il faut « comprendre » les données avant d’essayer de les modéliser. Cela rend nécessaire de passer par une phase descriptive souvent très avancée. Cette phase en elle même doit d’ailleurs inclure des phases de datamanagement plus ou moins complexes en fonction de la multiplicité des sources que l’on veut traiter.

En datamining, le descriptif permet de répondre à la question « pourquoi ».

Les données à l’état brut sont malheureusement presque toujours incompréhensibles. Non seulement elles sont très vastes et composées de nombreux formats différents, mais surtout, l’information réellement utile peut être diluée voire totalement masquée. Vous pouvez transformer ces données en informations, qui permettent d’avoir des ordres de grandeurs, des tableaux de bord, des idées… C’est très bien, mais cela ne vous permet toujours pas de comprendre « pourquoi » et c’est souvent insuffisant pour agir efficacement.

Seul le datamining descriptif va vous apporter les outils, parfois en faisant appel à des connaissances métier spécialisées, comme par exemple la finance ou le marketing, qui vont réellement vous permettre de mettre au grand jour la connaissance fondamentale et actionnable qui se trouve dans vos bases. C’est pourquoi en datamining, il faut souvent aussi avoir une casquette d’expert métier en plus de celle de statisticien. La diffusion et le partage des résultats du marketing prédictif se joue aujourd’hui principalement à ce niveau-là.

C’est cette analyse descriptive qui rend en effet possible la modélisation et tous les calculs prédictifs ultérieurs. Tordons donc tout de suite le cou à une idée fausse bien trop répandue comme quoi seul le marketing prédictif est valorisant. La réalité est souvent inverse, d’ailleurs, le rapport de durée entre la phase de datamining descriptif et la phase prédictive est quelquefois énorme. C’est grosso-modo une loi de Pareto : 80% du temps est utilisé pour faire du descriptif et seulement 20% pour le prédictif. Au final, le prédictif est un peu la cerise sur le gâteau, le dernier résultat du datamining et souvent la partie apparente de l’iceberg qu’on communique. Mais très souvent, une grande partie de ce qu’on apprend d’important sur ses clients, ses marchés, ses produits et ses campagnes provient principalement de la partie descriptive.

Didier Gaultier, Directeur de la Business Unit Datamining chez Coheris et professeur de marketing prédictif à l’EPF, réagit sur les changements et les idées reçues qui animent le monde du datamining et du marketing prédictif.




Commentaires

1.Posté par Vallaud Thierry le 11/04/2012 23:11
Je me demande si l'EDA inventée au début des années 80 ce n'est pas cela http://www.amazon.fr/s/ref=nb_sb_noss?__mk_fr_FR=%C5M%C5Z%D5%D1&url=search-alias%3Denglish-books&field-keywords=explonatory+data+analysis
Evidement les outils de Coheris dont SPAD doivent vous permettre de faire une bonne EDA mais la connaissance préalable de ces techniques me semblent indispensables
Une EDA maximiser permet par exemple dans la détection du churn de trouver toutes les variables prédictives de celui préalablement au modèle lui même le modèle devenant alors que confirmatoire.
Relire aussi Data Preparation for Data Mining de Pyle.

Nouveau commentaire :
Facebook Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.