Pentaho 6.0 automatise le pipeline des données analytiques de l’entreprise


Rédigé par Communiqué de Pentaho le 30 Septembre 2015

De nouveaux services de données performants, tels que des jeux de données virtualisés, la mise en forme des données et la collaboration font du croisement des Big Data une réalité



Pentaho, société du groupe Hitachi Data Systems, présente en avant-première la version 6.0 de sa plateforme d’intégration et d’analyse des Big Data qui sera officiellement disponible le 14 octobre, lors de la conférence PentahoWorld. La nouvelle version 6.0 constitue la première version du serveur Pentaho pour l’entreprise grâce à des fonctionnalités conçues pour automatiser, gérer et améliorer chaque étape du pipeline des données analytiques. Cette version conduit les clients au plus près de la vision audacieuse de Pentaho en matière de gouvernance des données, c’est-à-dire la capacité à croiser n’importe quel type de données fiables et actualisées pour alimenter l’analytique à grande échelle.

Des options flexibles pour activer les données
Avec l’expansion du Big Data dans l’entreprise, un éventail d’architectures de données a vu le jour pour répondre aux différents cas d’utilisation. D’un côté, les entrepôts de données traditionnels hébergent des données préparées et structurées ; de l’autre, les lacs de données rassemblent des données natives brutes. Les raffineries de données, qui permettent de transformer les données brutes trop variées et encore instables conservées dans le lac de données, se situent à mi-chemin. Alors que les cas d’utilisation évoluent, les entreprises peuvent compter sur Pentaho 6.0 pour fournir efficacement des données gouvernées de façon adéquate à toutes les étapes du pipeline à chaque utilisateur ou application.

« Notre étude comparative sur l’analytique des Big Data révèle que 95 % des entreprises utilisent l’analytique pour les Big Data ou ont l’intention de le faire. Cependant, les entreprises ont besoin de logiciels performants pour gérer le flux de processus d’une multitude de sources de données diverses, de manière évolutive, afin de créer des jeux de données analytiques unifiés qui conduisent à des informations détaillées. C’est une des façons les plus efficaces de générer les informations à valeur ajoutée qu’attend la direction, » explique Tony Cosentino, VP et directeur de recherche chez Ventana Research. « Dans cette dernière version, Pentaho 6.0 permet non seulement de gérer le flux des processus de transformation, mais aussi d’automatiser l’intégralité du pipeline des données analytiques ».

Faire du croisement des Big Data une réalité
Pentaho 6.0 offre de nouveaux services et options de mise à disposition des données pour :
● Croiser et virtualiser des jeux de données à la volée afin d’accélérer l’accès et accroître la flexibilité lors de l’agrégation des données

● Assurer en continu le croisement des données à grande échelle grâce à une « transmission optimisée », c’est-à-dire la transformation des données orientée vers les processus de traitement les plus efficaces

● Mettre facilement en forme les données les plus complexes

● Suivre et stocker les détails de la traçabilité des données à chaque exécution de processus

● Améliorer les fonctions de collaboration de façon à partager les résultats d’exploration de données avec des outils perfectionnés de modélisation en ligne (modification du modèle en aller et retour)


Maîtriser le pipeline de données analytiques
Pentaho 6.0 renforce la plateforme Pentaho pour gérer l’expansion des pipelines de données grâce à de nouvelles fonctions :
● Traçabilité des données pour aider les utilisateurs à identifier l’origine des données

● Intégration plus étroite avec SNMP grâce à des améliorations majeures du monitoring des systèmes pour une plus grande visibilité sur l’entreprise

● Mise à niveau et amélioration de Spring Security, le framework Java/Java EE qui fournit les outils d’authentification et d’autorisation ainsi que d’autres mécanismes de sécurité pour les applications d’entreprise

● Amélioration de la mise en cache des services de données pour des performances optimales des jeux de données virtualisés

● Prise en charge de la spécification OSGI, système modulaire et plateforme de services destinés à Java


« Pentaho 6.0 est un cap important de notre vision, dont l’objectif est d’aider les entreprises à extraire de la valeur de tous types de données dans n’importe quel environnement, indépendamment de la complexité de l’architecture ou de la profusion des flux de données », déclare Christopher Dziekan, Chief Product Officer, Pentaho. « Les entreprises pilotées par les données peuvent ainsi avoir la certitude que leurs données sont correctement gouvernées et diffusées au vers les point d’impact, qu’elles soient consommées par un utilisateur interne, un utilisateur externe ou une application tierce.

Pentaho 6.0 sera disponible en téléchargement le 14 octobre 2015, lors de la conférence PentahoWorld qui se tiendra à Orlando en Floride. Les participants à la conférence PentahoWorld pourront assister à des démonstrations de 6.0 et apprendre, auprès des créateurs, comment maîtriser les flux de données. Les billets sont disponibles sur le site www.pentahoworld.com.



Dans la même rubrique :