Pentaho, mise en place d'une solution Open Source de Business Intelligence


Rédigé par Communiqué des Editions ENI le 14 Avril 2011

Editions ENI
Auteur : Christian VIGOUROUX
Collection : Epsilon



Ce livre sur Pentaho s’adresse à tout informaticien désireux de mettre en place les principales briques de ce puissant outil de Business Intelligence Open Source. Pour chaque brique de la suite Pentaho détaillée dans le livre (en version 3.6 au moment de l’écriture), une procédure d'installation est décrite en détail. L’auteur propose ensuite une présentation détaillée puis une étude de cas avec de nombreux exemples concrets. Plutôt qu'une étude exhaustive des multiples composants faisant partie de la suite Pentaho, l'option retenue est de mettre l'accent sur les modules principaux en privilégiant une approche par l'exemple.
Dans les premiers chapitres, après une présentation rapide des concepts utilisés en Business Intelligence, l’auteur propose une prise en main rapide de Pentaho (installation de la suite, interfaces d'administration…) accompagnée de nombreux exemples d’utilisation. Des rappels sont ensuite faits sur la modélisation (modèle en étoile, modèle en flocon de neige, cube, dimension, mesure, ...) et sur la construction d'un Datawarehouse. Les fonctionnalités de l'ETL Pentaho Data Integration sont listées et de nombreuses transformations sont analysées. L’auteur décrit le générateur de rapports Adhoc (WAQR) toujours au travers d'exemples.
Une partie importante du livre est consacrée au puissant générateur de rapports et de graphes Pentaho Report Designer, illustrée là encore par de nombreux exemples. Un autre volet conséquent est dédié à la modélisation et à l'exploitation de cubes de données multidimensionnelles. Mondrian (moteur multidimensionnel), MDX (langage de manipulation de données multidimensionnelles), JPivot (interface de restitution des résultats) et Pentaho Schema Workbench (assistance à la modélisation) sont détaillés. Le module Pentaho Aggregator Designer vient optimiser l'exploitation des données sous Mondrian en réalisant des agrégations. Le module Pentaho Design Studio (PDS), servant à l'installation des développements réalisés (transformations, analyses, rapports, ...) sur le serveur Web Pentaho est aussi largement commenté.
L’auteur met également en avant l'interopérabilité de la suite Pentaho avec des briques Open Source tierces, comme le générateur de rapports BIRT. Le puissant outil de Data Mining Weka, désormais intégré dans la suite Pentaho, et qui permet l'analyse des données au travers de multiples algorithmes est traité. L’auteur décrit la gestion des métadonnées via Pentaho Metadata Editor qui rend l'exploitation des données plus aisée dans les différents modules de la suite Pentaho par la création de vues métier.
L'ensemble des exemples et les jeux de données nécessaires sont en téléchargement sur le site www.editions-eni.fr.

Les chapitres du livre :
Introduction : présentation de Pentaho – Prise en main rapide de Pentaho – Exemples Pentaho – Modélisation en Informatique Décisionnelle – Présentation de l’ETL PDI – Mise en œuvre de PDI – Présentation de WAQR – Mise en œuvre de WAQR – Présentation de PRD – Mise en œuvre de PRD – Présentation de Mondrian/JPivot – Mise en œuvre de Mondrian/JPivot – Modélisation Mondrian via PSW – Agrégation de données via PAD – Intégration des composants via PDS – Intégration de rapports BIRT – Analyse de données via Weka – Gestion des métadonnées via PME – Glossaire OLAP



Dans la même rubrique :