Big Data, Science des données, aide à la décision en entreprise, business intelligence, data warehouse, reporting, OLAP, web analytics, data visualization, data mining, internet des objets, informatique cognitive, intelligence artificielle...

Abonnez-vous gratuitement à Decideo !


Decideo

 


Plateformes prédictives: comment arbitrer entre mutualisation et rétention des données ?


Rédigé par Jean-Cyril Schütterlé, Sidetrade le 25 Février 2017

Les technologies de Machine Learning ne tiennent leurs promesses d’automatisation des traitements que lorsqu'elles disposent de données suffisamment représentatives du domaine auquel elles s’appliquent. La détection des spams est d'autant plus efficace que l'algorithme d’apprentissage a été alimenté de nombreux exemples. Un système de pilotage de voiture autonome ne sera opérationnel que s’il a appris à reconnaître les autres véhicules et la signalisation routière à partir d'images prises dans la circulation. Une application d'aide au diagnostic nécessitera l'accès à des banques d'images médicales, un moteur de traduction automatique s'appuiera sur des bibliothèques de textes déjà traduits etc.



Jean-Cyril Schütterlé, Directeur Produit et Data Science de Sidetrade
Jean-Cyril Schütterlé, Directeur Produit et Data Science de Sidetrade
Ce principe ne se dément pas lorsque le Machine Learning est mis en œuvre dans le monde de la gestion. Les entreprises l'ont bien perçu. Elles ont ainsi fait émerger des rôles de Chief Data Officers avec pour objectif de décloisonner les données qui dorment dans des silos organisationnels.

Cependant, puisque la performance dépend de l'accumulation rapide de données représentatives, ne faut-il pas aussi faire tomber les murs séparant chaque organisation du monde extérieur ?

Plateformes prédictives : le challenge de la data

L'émergence de plateformes prédictives SaaS (ou DaaS, Data as a Service) proposant d'appliquer le Machine Learning à des thématiques variées (détection d'opportunités commerciales, optimisation des processus de vente, modélisation et planification financière, détection des risques de défaut, prévision des délais de paiement, etc.) soulève la question avec une acuité particulière. Chaque plateforme héberge en effet les données confiées par ses clients sur une infrastructure commune. Il est donc techniquement très simple de les mutualiser afin d'augmenter la profondeur du champ d'investigation des algorithmes et, par conséquent, la qualité de l'information restituée à l'utilisateur.

Prenons l'exemple d'une plateforme d’évaluation de leads commerciaux. La mise en commun des informations détenues dans l'ensemble des bases CRM des sociétés utilisant ce logiciel permettrait d’analyser les comportements d’achat de leurs clients sur un spectre beaucoup plus large et d’anticiper leurs besoins beaucoup plus précisément qu'en exploitant séparément chaque source de données. Cependant, des concurrents peuvent figurer parmi les utilisateurs de la plateforme. Les sociétés sont donc assurément réticentes à voir leurs données exploitées au bénéfice de possibles rivaux.

Mutualisation versus rétention de l’information

Le dilemme est ainsi posé : personne ne souhaite partager ses données mais chacun bénéficierait d'un accès à celles des autres. Il s'agit par conséquent pour le décideur de naviguer entre deux écueils tout aussi dangereux : brider des technologies qui s’avèrent cruciales pour la performance future de son organisation ou laisser des tiers bénéficier de ses informations propriétaires qui, comme le proverbial dentifrice, ne pourront être remises dans le tube une fois divulguées.

Faute de pouvoir jouer les passagers clandestins, l'organisation doit établir un bilan coût-avantage qui permette d'opter au cas par cas entre rétention et mutualisation des données.




Commentaires

1.Posté par Vallaud Thierry le 28/02/2017 23:09
L'idée peut sembler alléchante mais au delà des problèmes de concurrence évoquée dans l'articile comme déjà pour la plupart des bases mutualisées il a le risque du sur solicitation de toujours les mêmes contacts les plus réactifs. Ensuite on peut imaginer un pb juridique peut être moins en BtoB qu'en BtoC sur la propriété de l'information et sa détention vis à vis du client final. Enfin une donnée peut être très pertinente dans un contexte donné mais absolument pas dans un autre voir contreproductive. Donc l'un dans l'autre la donnée nominative mutualisée entre acteurs c'est compliqué mais si cela existe depuis plusieurs années en VPC par exemple.

Nouveau commentaire :
Facebook Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.