Oracle rattrape (en partie) son retard en Data Visualization
Claude-Henri Mélédo
Le Graal de la « Data Visualization » est non seulement de disposer de la plus grande variété de graphiques, mais ensuite d’aider les utilisateurs à choisir la bonne représentation (au sein de cette offre devenue pléthorique).
Durant le salon « Oracle Open World » d’octobre 2011, l’éditeur américain a révélé l’application EXALYTICS et ses capacités « In-Memory » et de « Data Visualization ». C’est cette nouvelle représentation graphique que je vais commenter.
.
Small Multiples / Chart Matrix… Donc des mosaïques de Sparklines
La matrice de graphes (précisément des dizaines de micro-graphes / sparklines) n’apparaît que chez les éditeurs ayant un vrai degré de maturité en « Data visualization ».
En effet la matrice de graphes - aussi appelée « trellis charts » - permet d’ultra-densifier l’analyse de données, en mettant bien plus qu’une donnée dans chaque cellule du tableau : chaque case de la grille inclut un graphe, généralement soit une courbe de tendance, soit un graphe en colonne.
Cette solution permet de démultiplier les analyses de cas sur une grille multidimensionnelle (principe du "Tableau Croisé Dynamique") où la comparaison entre cases devient évidente, même sur des données ultra-densifiées au centimètre carré (puisque présentant des micro-graphes/ sparklines).
Certains logiciels en ont même fait une spécialité comme Tableau Software aux USA et Isthma en France.
.
Bien plus efficace que les « Motion graphics » interactifs (ex. : GapMinder ou applications écrites en Flash), cette matrice de graphes permet à l’utilisateur de prendre son temps :
- pour comparer différentes situations / points de vue d’un seul regard
- sans risque de défaillance de la mémoire de travail (rarement fiable au-delà de 5 objets pensés / chunks).
En conclusion aujourd’hui Oracle commence à maîtriser le langage graphique ; lequel deviendra un jour aussi indispensable que parler Anglais pour faire du business et analyser la masse croissante de données.
.
Quel graphique pour quelle donnée ?
Rares sont les chercheurs ayant tenté de modéliser l’algorithme d’aide au choix du graphique adéquat. Certainement parce que la formule inclut de nombreux paramètres :
- Nature des données (ex. : qualitatives ordinales)
- Type d’analyse souhaitée (ex. : Qui, Quoi, Quand, Où, Comment… Bref l'hexamètre de Quintilien)
- Moment de l’action et conditions (ex. : phase exploratoire, avec données en dimension)
- Degré de maitrise du langage graphique par l’utilisateur / de la disponibilité de son attention
A ma connaissance, seuls cinq logiciels au monde disposent d’une fonction d’aide au choix du graphique pertinent. La plus connue ("Show me" dans Tableau Software) a été créée par les concepteurs de ce logiciel sous le nom de Polaris quand ils étaient à l’Université Stanford dans les années 90.
Dans la mesure où j'étudie depuis plusieurs années ce sujet (Nb : C’est le titre même des Chroniques que vous lisez actuellement : "Quel graphique pour quelle donnée ?"), j’étais donc impatient de voir la fonction qu’Oracle avait annoncée. La fonction s’appelle « Presentation Suggestion Engine (PSE) » et permet de préconiser le graphe pertinent en fonction du type d’analyse :
- Valeurs
- Valeurs explicites
- Totaux
- Pourcentages
- Tendances
- Corrélations
Je ne vous fatiguerai pas avec une analyse trop longue. Mais déjà vous comprendrez qu’il y a des manques dans cette première version de PSE quand on sait que :
- il n’y a pas de diagramme ou de réseau nœud-lien (ex.: graphe social) parmi les graphiques proposés,
- les analyses ne séparent pas la distribution de la décomposition,
- le rang ou l’écart ne sont spécifiés comme traitements particuliers.
.
Les éditeurs continuent de confondre « Nouveau » et « Innovant »
Dans les mauvaises surprises, Oracle a aussi ressorti la décomposition hiérarchique en anneaux, qui présente les mêmes défauts que le « graphe en secteurs »(*)… mais N fois pire selon le nombre N d’anneaux concentriques.
* : le graphe en secteur est communément appelé « camembert » par les français et « pie chart » par les américains... selon leurs habitudes culinaires ethnocentriques.
Malheureusement Oracle propose là une fonction qui voudrait faire confondre « Nouveau » (mais sans en garantir la pertinence) et « Innovant » (apportant une vraie valeur jusqu’alors inconnue).
Pour plus d’explications sur les dangers du « Camembert », allez sur :
http://www.decideo.fr/datavisual/Le-Camembert-Par-dela-la-polemique-quand-peut-on-utiliser-ce-graphique_a24.html
.
.
Plus d’explication sur EXALYTICS :
l [http://www.oracle.com/us/products/database/exadata-database-machine/exalytics-introduction-497958.pdf ]l
l [http://www.informationweek.com/news/software/info_management/231700139 ]l
l [http://www.digi.no/879459/oracle-lanserer-spaamaskin ]l
> A LIRE EN CE MOMENT SUR DECIDEO
-
Le nouvel outil Webfleet Transition EV permet l’électrification des flottes par la donnée
-
Alteryx et DataCamp s'allient pour permettre à tous les salariés de se former à l'analyse
-
Quel est le futur des métiers de la data et de l’IA vu par les grands groupes français ?
-
OneStream Software réinvente et renforce le rôle du CFO grâce à sa nouvelle solution Narrative Reporting
-
Empreinte de la Donnée sur le vivant : Le Cercle de la Donnée et l’Agora 41 présentent 5 propositions pour un numérique responsable
-
Les dirigeants adoptent l'IA sous la pression médiatique, mais la préparation organisationnelle reste un défi majeur
-
La NASA s’appuie sur le moteur d’Enterprise Search de Sinequa pour propulser son nouveau moteur Science Discovery Engine
-
IA, simplification et débureaucratisation pour transformer l'État
-
GS1 France aux côtés d’Equadis pour développer la solution « Data Quality Checker » garantissant l’échange de données de qualité sur le marché français
-
XXII lance RETAIL ANALYTICS, une innovation majeure pour le secteur du retail