Decideo.fr

Communauté francophone des utilisateurs et fournisseurs d'outils d'aide à la décision en entreprise


 



     

Le Drill-Down au service du Data Mining


Samuel DODE



Le Drill-Down au service du Data Mining

L'une des étapes préliminaires aux projets de data mining consiste à explorer les données de façon interactive, afin de pouvoir dégager une première "impression" sur les variables. Le data mining visuel, notamment le Drill-Down Interactif fournit une combinaison d'outils graphiques, d'analyses exploratoires qui vont permettre d'étudier rapidement la distribution des variables, les relations entre elles et d'identifier les observations appartenant à des sous-groupes spécifiques dans les données.

Ce puissant outil graphique, permet de sélectionner tout ou partie des variables étudiées et de regarder interactivement ce qui se passe "à l'intérieur" de chacune d'elles, en cliquant simplement sur des modalités particulières par exemple dans un histogramme.

Comment Fonctionne le Drill-Down Interactif
Dans le contexte du data mining, l’outil vous permet de sélectionner des observations issues de jeux de données gigantesques en sélectionnant des sous-groupes sur la base de modalités spécifiques ou d'intervalles de valeurs de certaines variables intéressantes ; d'une certaine manière, vous pouvez mettre en évidence les "couches les plus profondes" ou les "strates" de vos données en étudiant des sous-ensembles d'observations de plus en plus petits, déterminés par des filtres logiques de plus en plus complexes.

Prenons l’exemple d’une banque qui souhaite étudier la solvabilité selon différents critères sociologiques : type d’emploi (ouvrier, ingénieur, cadre, …), statut marital, nombre d’enfants, type de logement, nombre de prêts au cours des N dernières années …
Le data miner va pouvoir choisir l’une de ses variables puis étudier chacune de ses classes et étudier la solvabilité en affinant étape par étape la décomposition en sous-classes. On définit ainsi des sous-ensembles de données sur lesquels on peut calculer de nouvelles statistiques et mettre en évidence des observations atypiques. Il est alors très facile de poursuivre l’étude en profondeur et/ou de remonter d’un niveau de sélection (Drill-up) pour choisir une autre modalité, un autre groupe et poursuivre l’analyse.

Le drill-down se fait aussi bien sur des variables catégorielles que continues. Pour les variables catégorielles, les catégories sont directement disponibles dans les données. Pour les variables continues, il existe un certain nombre de méthodes pour ventiler les valeurs en catégories. Par exemple, on peut définir un certain nombre de catégories dans lesquelles seront réparties l'étendue des valeurs de la variable continue de drill-down, il est aussi possible de spécifier l’incrément des catégories consécutives ou de spécifier des bornes spécifiques pour les variables continues du drill-down. Par exemple, pour une variable continue Revenu, des tranches de revenu adaptées à l’étude peuvent être définies, puis le data miner réalise une opération de drill-down sur ces tranches afin d'étudier la distribution des variables à l'intérieur de chaque tranche.

STATISTICA Data Miner, solution de data mining de la gamme STATISTICA intègre plusieurs centaines de fonctionnalités de data mining, dont le Drill-Down interactif.

Jeudi 22 Mars 2007
Lu 6560 fois

Dans la même rubrique :

« »









 









Last News from B-Eye-Network
Blog LeGrandBI
Actu Forum Decideo
Vos derniers commentaires
SUR LES BLOGS DE NOS LECTEURS
le 10/07/2010

Balanced Scorecard : le constat du club Balanced Scorecard France (1)

Il n’est nul besoin de présenter le Balanced Scorecard (BSC) traduit en français par Tableau de Bord Prospectif Equilibré (TBPE). Cette démarche, créée il y a 15 ans par les Drs Robert Kaplan et...

le 02/07/2010

Quel talent !

La parabole des talents est présente dans nos esprits. Elle nous dit que le talent ne doit pas être caché, qu’il doit se développer et, d’une certaine façon, il ne nous appartiendrait qu’en...

le 01/07/2010

Les systèmes décisionnels ingurgitent de nouvelles données

L’emploi de systèmes décisionnels ne cesse de se développer ces dernières années. Non seulement ils sont mis en œuvre par toute les fonctions de l’entreprise, mais au-delà de leur vocation à...

le 28/06/2010

Les règles ne remplacent pas l’éthique

Avec la crise, certains mots d’ordres reviennent en force – Réguler, Moraliser, Responsabiliser - La mise en place de procédures formelles qui fixent la conduite des affaires est certes nécessaire....

le 01/06/2010

Des solutions technologiques spécifiques pour le système d’information décisionnel

Il n’y a pas de jugement possible, pas d’appréciation saine de la réalité sans repère. Si l’on veut avoir une réflexion stratégique par exemple, il est préférable de l’inscrire dans une période...





Toute reproduction ou représentation intégrale ou partielle, par quelque procédé que ce soit, des pages publiées sur ce site, faite sans l'autorisation de l'éditeur est illicite et constitue une contrefaçon. Arche Numérique Médias s'est engagé à respecter la confidentialité des données personnelles régies par la loi 78-17 du 6 janvier 1978.

Decideo.fr | RelationClient.net | Progilibre.com | DAF.info | ECONOtique.com | Zetta.fr | Nieuwbourg.com | Nieuwblog.com | Forum Decideo |

BeyeSEARCH | BeyeBLOGS | BeyeRESEARCH | TDAN.com | BeyeNETWORK BeyeNETWORK USA BeyeNETWORK UK BeyeNETWORK Germany BeyeNETWORK India BeyeNETWORK China