Pivotal Big Data Suite accélère la transformation numérique avec une mise à jour de la distribution Apache Hadoop et des performances analytiques de nouvelle génération


Rédigé par Communiqué de Pivotal le 12 Mai 2015

Des mises à jour majeures de composants apportent des gains de performances pouvant atteindre un facteur 100 à la base de données Pivotal Greenplum
La nouvelle distribution Apache Hadoop basée sur le socle Open Data Platform améliore la stabilité, la gestion, la sécurité, la supervision et le traitement des données pour répondre aux besoins de l’entreprise moderne



En résumé :

● Afin d’aider les entreprises à créer de nouvelles applications orientées données, différenciées, Pivotal annonce des mises à jour significatives de Pivotal Big Data Suite, notamment pour Pivotal HD, sa distribution Apache Hadoop, ainsi que des gains de performance de la base de données Pivotal Greenplum et de Pivotal HAWQ, les outils analytiques intégrés à la suite.


● Pivotal HD, reposant sur le socle Open Data Platform, bénéficie d’une mise à jour majeure de la pile Hadoop, destinée à améliorer la stabilité, la gestion, la sécurité, la supervision et le traitement des données.


● La base de données Pivotal Greenplum offre des gains de performance pouvant atteindre un facteur 100 avec l’ajout de Pivotal Query Optimizer, un optimiseur de requêtes avancé, basé sur les coûts, pour les Big Data.


● Ces nouvelles capacités de Pivotal Big Data Suite sont disponibles dès à présent.

A l’ occasion de l’EMC World (Las Vegas, 4-7 mai 2015), Pivotal®, le spécialiste de l’accélération de la transformation numérique des entreprises, a annoncé des mises à jour significatives de Pivotal Big Data Suite. Il s’agit notamment de mises à jour majeures de Pivotal HD, sa distribution Apache™ Hadoop®, et de gains de performance pouvant atteindre un facteur 100 pour ses solutions analytiques, dont la base de données Pivotal Greenplum®, qui s’accompagne désormais de Pivotal Query Optimizer, l’optimiseur de requêtes le plus avancé, basé sur les coûts, pour les Big Data. Ces améliorations ont pour but d’aider les entreprises à gérer des volumes de plus en plus croissants de données générés par les mobiles, le cloud, les réseaux sociaux et l’Internet des objets, et à exécuter les requêtes les plus complexes sur ces données avec une rapidité, une capacité de montée en charge et une souplesse sans précédent.



La maîtrise des Big Data, les méthodologies agiles et les applications cloud natives sont des éléments essentiels pour la transformation numérique de l’entreprise. Reposant sur l’open source et sur un modèle d’abonnement, Pivotal Big Data Suite intègre des logiciels modernes et évolutifs, conçus pour supporter les architectures de données existantes comme les nouvelles. En une seule solution, Pivotal regroupe ainsi l’ensemble des capacités de traitement des données, analytiques et applicatives nécessaires pour aider les entreprises à optimiser leurs analyses et leurs expériences utilisateurs, avec la stabilité et la sécurité dont elles ont besoin.



A l’origine des importants gains de performance de la base de données Pivotal Greenplum et de Pivotal HAWQ® : le nouveau Pivotal Query Optimizer, l’optimiseur de requêtes le plus avancé, basé sur les coûts pour les Big Data. Pivotal Query Optimizer est reconnu pour sa capacité à nettement améliorer les performances de Pivotal HAWQ, le moteur SQL d’entreprise le plus évolué au monde sur Hadoop, et de la base de données Pivotal Greenplum.


Pivotal Big Data Suite intègre la première version de Pivotal HD basée sur un socle Open Data Platform (ODP) et comprend des mises à jour majeures de composants Apache Hadoop, notamment Apache Spark™. Pivotal Big Data Suite est conçu pour optimiser les capacités de la pile Hadoop en matière de stabilité, de gestion, de sécurité, de supervision et de traitement des données. Les entreprises peuvent ainsi confier à Hadoop des applications plus critiques, afin de stocker et de traiter à moindre coûts des données volumineuses, en conformité avec les règles et réglementations en vigueur.





Base de données Pivotal Greenplum et Pivotal HAWQ

● Gains massifs de performance grâce à Pivotal Query Optimizer, l’optimiseur de requêtes le plus avancé, basé sur les coûts, pour les Big Data.

● Capacité à gérer un grand nombre d’applications diverses avec un haut niveau de performances, permettant à de vastes équipes de travailler simultanément sur de multiples cas analytiques.

● Capacité à traiter des volumes Big Data à grande échelle sans dégradation de performances.

● Optimisation de la structure et des capacités de gestion des données



Pivotal HD

● Repose désormais sur un socle Open Data Platform standard, comprenant Apache Hadoop 2.6 et Apache Ambari.

● Mises à jour des composants Hadoop existants pour les scripts et les requêtes (Apache Pig et Apache Hive™), les bases de données non relationnelles (Apache HBase™), ainsi que la coordination de base et l’orchestration des workflows (Apache Zookeeper™ et Apache Oozie).

● Ajout du noyau Apache Spark et d’une bibliothèque d’apprentissage automatique.

● Adjonction de composants Hadoop supplémentaires pour améliorer la sécurité (Apache Ranger - en incubation, Apache Knox), la supervision (Nagios, Ganglia aux côtés d’Apache Ambari) et le traitement des données (Apache Tez).



Ouverture. Agilité. « Cloud Ready ».

Pivotal Big Data Suite permet aux entreprises de moderniser leur infrastructure de données, d’effectuer des analyses plus poussées et de bâtir des applications à grande échelle avec un certain nombre de solutions de référence mises à leur disposition via un abonnement unique. La suite intègre des services applicatifs lancés récemment, qui fournissent aux développeurs la possibilité d’exploiter des bases de données SQL et NoSQL, d’effectuer le traitement in-memory et des environnements temps réel pour assurer la haute disponibilité et la résilience de leurs applications stratégiques innovantes. Les composants de Pivotal Big Data Suite peuvent être déployés sur du matériel standard, des appliances pré-certifiées, des instances virtualisées et de cloud privé, ainsi que dans des clouds publics.






Commentaires


Sundeep Madra, vice-président Data Produit Group, Pivotal

« A mesure que le coût de l’informatique baisse et que les accès deviennent universels, les entreprises vont devoir faire face non seulement au déluge de données généré par les applications et les interactions clients, mais aussi aux milliards de terminaux qui se connectent à leurs réseaux. Les investissements continus de Pivotal dans Big Data Suite permettent aux entreprises de créer un véritable impact en ouvrant la voie à des applications évolutives, des outils analytiques capables de prévoir les comportements et de préconiser des actions et, enfin, à une solution réaliste pour répondre à leurs aspirations de transformation numérique. »



Sergey Sotnichenko, responsable Datawarehousing et Reporting, Tinkoff Bank

« Les nouvelles fonctionnalités de la base de données Pivotal Greenplum devraient optimiser l’utilisation de nos ressources matérielles et les performances des requêtes complexes sur les Big Data. Cela pourrait nous permettre de gagner du temps pour l’obtention d’analyses pertinentes et fiables et leur exploitation rapide au moyen des ressources existantes. »



Zhang Min, vice-président, CITIC Bank

« Utilisateurs de longue date de Greenplum, nous sommes très heureux de voir Pivotal continuer d’investir dans cette base de données. La solution actuelle est déjà très performante ; ces nouveautés vont raccourcir les cycles d’innovation en permettant l’exécution de requêtes complexes sur de vastes ensembles de données et en rapprochant l’analytique des Big Data. »



Dans la même rubrique :