Note de recherche | Analyse prédictive : le tiercé gagnantPropos recueillis par Sylvie Druart
Jeudi 1 Septembre 2005
Le marché de l’analyse prédictive, comme beaucoup d’autres, se positionne clairement aujourd’hui autour des utilisateurs métier. Ces derniers attendent, en effet, une grande rentabilité et réactivité de la part de ces outils. Françoise Soulie-Fogelman, consultante indépendante, nous donne son tiercé gagnant dans la course Analyse Prédictive : SAS, SPSS et KXEN.Nieuwbourg Group : Quels sont les pré-requis à l’analyse prédictive ?
Françoise Soulie-Fogelman : en général, un système CRM habituel car dans neuf cas sur dix, le prédictif s’adresse au CRM. Techniquement, une interface est réalisée à partir des bases de production sur laquelle est réalisé du CRM analytique. Cette base de données clients est connectée directement ou au travers d’un datamart intermédiaire, avec le front office. Dans ce dernier se retrouvent les modules d’automatisation des forces de vente (SFA), le marketing et par exemple, le service clients (téléphone, web ou multicanal).
Le CRM analytique permet le reporting et le data mining dans lequel se trouve le prédictif. Le reporting consiste à prendre les données du passé, les analyser, les présenter dans des tableaux de bord. Il s’agit de présentation de données (tableaux de bord, des camemberts, distribution de variables) et non de fabrication. Le data mining, quant à lui, comprend deux étapes : les statistiques sur les données et leur présentation. La partie prédictive est complètement différente : elle utilise les données du passé pour produire une prévision, donc une nouvelle variable ou un nouveau champ, valable dans l’avenir. Les pré-requis sont donc une base de données, un outil de data mining et la tête d’un statisticien, selon les outils utilisés. NG : Quelles sont les possibilités offertes ?
FSF : Supposons un vendeur qui consulte tous les mois sur son portable la liste des offres les plus susceptibles d’être achetées, c’est-à-dire accompagnées d’un score d’acceptation ou d’appétence à 98 %. Les valeurs présentées dans un tableau de bord sont justes à condition que tout l’ensemble soit correct alors qu’il est en général approximé ou estimé. En prédictif, le système fournit des valeurs approximatives ou probables ainsi que leur intervalle de confiance. En statistique, une courbe est établie.
Le marketeur décide de lancer une campagne de rétention à un certain nombre de clients. Deux stratégies s’offrent à lui : envoyer un message et un cadeau à tous les clients ou ne choisir que les clients qui ont de fortes chances de s’éloigner (churn). Il choisit donc les taux les plus élevés correspondants aux clients qui ont le plus de chances de s’en aller. En marketing, le prédictif réalise des scores afin de mieux cibler les campagnes et d’augmenter les taux de retour des campagnes. Dans le service client, l’application e-piphany chez Orange permet le temps réel en marketing entrant. Le télé-opérateur ayant le client au bout du fil réalise une liste des offres comportant des scores d’appétence puis propose à son client l’offre qui a la plus grande probabilité d’acceptation ou celle qui, pondérée par le revenu, est la meilleure. Les offres sont adaptées. NG : Quels sont les acteurs éditeurs du marché ?
: Tous les éditeurs proposent deux couches : des statistiques pures, c’est-à-dire la fabrication des histogrammes, des camemberts, des distributions de variables, des tests, etc. et le data mining, des régressions logistiques mais aussi des arbres de décision, des réseaux de neurones, par exemple.
Unica est un produit de gestion de campagnes, comme e-piphany. Il propose un module spécial, Affinium Model, dont la particularité est d’être utilisé en mode automatique. L’outil lance une collection de modèles data mining différents et en définit le meilleur. Un statisticien expert peut aller plus loin dans l’utilisation du produit. NG : Comment faire la distinction entre toutes les offres ?
FSF : Aujourd’hui, il existe deux populations d’utilisateurs : les statisticiens du département études et l’utilisateur final du centre d’appels, le vendeur, le département marketing ou le service client. Les solutions ne sont pas conçues pour ces deux populations. E-piphany et Unica fonctionnent en mode pousse bouton, sans connaissances en statistiques. Pour un outil comme KXEN, un statisticien a forcément été, à un moment donné, dans la boucle. Sachant que KXEN est utilisé en l’absence de département études, mais avec des collaborateurs métier (marketing par exemple) qui connaissent les données et savent appréhender la complexité d’une donnée et sa signification. Typiquement, un résultat avec KXEN s’obtient en 24 heures. En comparaison, avec SAS, il faut compter deux mois de travail, même si dans ce cas, le résultat risque d’être meilleur.
Amadea, l’outil de Isoft, est un outil ETL qui transforme des données pour le mining. Ce que fait SAS en trois semaines, Amadea le réalise en 24 heures. Les entreprises recherchent les outils qui permettent d’aller vite car elles n’ont plus les départements études pléthoriques. Sans utilisateur pro SAS, il faut trouver autre chose. SAS est une Roll’s Royce. SAS et SPSS sont à peu près au même niveau. Le gros problème de SAS est son look années 50, au contraire de Statsoft qui ne coûte que 1000 €. NG : Quid de Hyperion ou de Informatica ?
FSF : Il s’agit de reporting. Business Objects possède un module qui s’appelle Predictive Analysis qui inclut KXEN.
NG : Quelle est la cible ? Beaucoup de FAI s’équipent de ce genre de systèmes ?
FSF : C’est clairement une problématique du secteur, comme pour les banques et les assurances, mais avec des types d’analyses différentes. Les banques pratiquent généralement des scores de risques. Les telcos, du score d’appétence ou du churn. Les banques et assurances sont bien équipées en SAS qui permet d’aller très loin, à condition d’être très expérimenté.
NG : D’où l’évangélisation vers les écoles ?
FSF : Effectivement, car le produit est très cher.
NG : Le marché aujourd’hui et demain ?
FSF : Depuis un an, les utilisateurs de l’analyse prédictive sont des personnes métier, exactement comme dans la BI. Au début, les utilisateurs métiers voulaient des tableaux de bord mais dépendaient de l’informatique pour les obtenir. Puis, certains éditeurs ont permis de donner la main aux utilisateurs. Il existe d’une part, des outils comme SAS et SPSS dédiés aux statisticiens et d’autres dont KXEN est prototypique qui, au contraire, sont à destination de l’utilisateur final.
Aujourd’hui, le marché aux Etats-Unis est très actif sur les aspects prédictifs. En France, il reste très calme. Je ne pense pas qu’il y ait une explosion du marché avec la création de nouveaux acteurs, mais plutôt la consolidation des acteurs en place. Bien entendu, d’autres petits acteurs gravitent autour de ce marché. Actuellement, les sociétés possèdent des data warehouses qu’elles souhaitent rentabiliser. Un tableau de bord peut rapporter des gains de productivité, en compréhension du métier mais à moyen terme. Une analyse prédictive sur une campagne marketing, par exemple, fournit un ROI instantané. Mais les applications sont plus vastes : comprendre les achalandises, le fonctionnement des clients, la position d’un magasin par rapport à un autre, etc. NG : Quelques conseils avant l’installation ?
FSF : Le premier, la constitution de la base de données puis du datamart et logiquement, la réplication des données. Une étape souvent fastidieuse sauf pour certains outils comme KXEN qui ont automatisé le procédé. Deuxième, l’industrialisation du pilote qui vient après l’exploration du modèle et la validation des utilisateurs. Cette fois encore, certains outils ont prévu l’intégration automatique dans le moteur de base de données. Enfin, la facilité à générer des rapports et des résultats ne doit pas être sous-estimée.
Lu 5028 fois
Nouveau commentaire :
|
Le Podcast de la BI
|
||||||||
|
|||||||||







