Big Data, Science des données, aide à la décision en entreprise, business intelligence, data warehouse, reporting, OLAP, web analytics, data visualization, data mining, internet des objets, informatique cognitive, intelligence artificielle...

Abonnez-vous gratuitement à Decideo !


Decideo

 


ClearPredictions : des modèles prédictifs en mode hébergé


Rédigé par le 12 Mai 2015

Découvrez vos données ! C’est la promesse de ClearPredictions, et ce même si vous n’êtes pas un statisticien professionnel. Ce nouveau service vous propose de construire vos modèles prédictifs en quelques clics et en quatre étapes simples : Charger vos données, analyser vos données, construire vos modèles, prédire.



ClearPredictions est un service proposé en cloud, qui va collecter, analyser, modéliser vos données et vous permettre de prédire certains événements, sans avoir besoin de maîtriser en détail l’art de la statistique. Les statisticiens affirmeront qu’il est absurde de faire confiance à la machine sans comprendre comment elle fonctionne; et ils n’ont pas tort. Les non-statisticiens répliqueront que l’on a pas besoin de comprendre le moteur à explosion pour conduire une voiture; et ils n’ont pas tort non plus. Et le débat restera intranchable, jusqu’au prochain article...

Mais pour ClearPredictions, le message est bien de mettre entre les mains de non-spécialistes, un outil simple pour modéliser un jeu de données, et de prédire les comportements de certaines variables. L’outil pourrait aussi être vu comme un apprentissage aux techniques de modélisation, un apprentissage par l’exemple, qui permet au non-statisticien de s’intéresser à ses chiffres.

Mais soyons concrets. Que permet de faire ClearPredictions et comment fonctionne-t-il ?

- Première étape, l’ingestion des données : à partir d’un fichier plat de type CSV ou XLS, vous alimenterez ClearPredictions avec des données constatées. Comme l’explique l’éditeur dans la vidéo ci-dessus, vous collecterez par exemple la liste de vos clients, actuels et passés, avec l’ensemble des données, en colonne, dont vous disposez; y compris bien sur les données dont vous ne pensez pas qu’elles puissent avoir un impact sur le modèle. L’objectif est d’étudier toutes les corrélations possibles.

- Deuxième étape, l’analyse : bien sur, parmi ces données ingérées, doit figurer la donnée cible, celle que l’on souhaite prédire. La phase d’analyse va donc consister à analyser les données qui participent à la détermination de la cible. On va instantanément visualiser la distribution des valeurs de la cible, et les données les plus corrélées. Pour chaque variable, on visualisera l’impact de ces valeurs sur la donnée cible.

- Troisième étape, la modélisation : cette étape de construction du modèle utilise huit algorithmes d’apprentissage machine (régression, arbres de décision, réseau de neurones…). Les huit méthodes sont appliquées et proposées, et un score de pertinence leur est attribué.

- Enfin, dernière étape, appliquer la modélisation à de nouvelles données : une fois l’un des modèles choisi, on télécharge un nouveau jeu de données, correspondant à celles que l’on souhaite prévoir. Évidemment, dans ce jeu de données, la cible n’est pas présente. Le système génère un nouveau fichier, dans lequel il ajoute sa prévision concernant la variable cible, et un coefficient de probabilité.

Fonctionnant en mode hébergé, ClearPredictions en est encore à ses débuts. Vous pouvez le tester gratuitement et vérifier qu’il répond à vos besoins. Par la suite, sous forme d’abonnement, vous pourrez choisir la formule qui dépend de votre usage : à partir de 95$/mois pour deux modèles et 25 000 prédictions et jusqu’à 3 000$/mois pour 50 modèles et 7,5 millions de prédictions.
La semaine prochaine, vous retrouverez dans Decideo une interview de Onno Pistorius, créateur de ClearPredictions.




Commentaires

1.Posté par Vallaud Thierry le 25/05/2015 11:52
Il y a plein d'offres du même type avec plus ou moins de "facilité" pour l'utilisateur :
- Microsoft Machine Learning https://www.youtube.com/watch?v=JexRmQfKWkQ
- Dataiku
Je vais les recencer toutes pour voir
Après sans être full web mais assez full asisted pour faire son premier modèle de "machine learning/data mining" et complétement gratuit http://orange.biolab.si/
A tester.....

2.Posté par Vallaud le 25/07/2015 18:00
J'ai testé pendant quelques temps, on finit pas s'y faire. C'est assez basique à tout les niveaux mais cela ne marche pas si mal. Après je pense qu'il faut une certaine pratique de l'analyse de données pour ne pas faire n'importe quoi.
Il faut dès le départ que les données est été préparée assez bien car ces fonctions sont limitées, pas contre les modèles présents sont très bien packagés et les résultats bien mis en évidence.
Le pricing modèle comme tous les outils distant est un peu flipant, à chaque rotation de modèle en production on doit se demander combien cela va t'il me couter au final.
A tester avec bienveillance et prudence.....

Nouveau commentaire :
Facebook Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.