MapR permet aux équipes DataOps de mieux valoriser l’ensemble de leurs données


Rédigé par Communiqué de MapR le 21 Novembre 2017

Disponible dès à présent, MapR Converged Data Platform 6.0 apporte des innovations en matière de sécurité, de base de données et d’administration automatisée, dans tous les environnements cloud.



MapR Technologies, fournisseur pionnier d’une plateforme pour tous les types de données dans chaque environnement cloud, annonce la disponibilité de MapR Converged Data Platform 6.0, offrant de nouvelles avancées pour aider les équipes DataOps à mieux valoriser leurs données. Les principales nouveautés de MapR sont une gestion innovante et automatique de l’état de la plateforme et de sa sécurité, une base de données révolutionnaire permettant le développement et déploiement d’applications de nouvelle génération. Grâce à MapR, les entreprises bénéficient d’une « data fabric » puissante et moderne, où les données sont capturées une fois et accessibles en tant qu’unique source, depuis les datacenters sur site, et dans les différents environnements cloud et jusqu’à la périphérie du réseau (Edge Computing).

DataOps est une pratique de plus en plus utilisée par les grandes entreprises dont les équipes de data scientists, développeurs et autres spécialistes des données entraînent des modèles d’apprentissage automatique et les mettent en production. La méthodologie DataOps a pour objectif de créer un workflow agile, en libre-service, qui favorise la collaboration transversale et stimule la créativité, dans le respect des règles de gouvernance des données. Accélérant la valorisation des données, elle se caractérise par des processus ainsi que par l’utilisation de technologies facilitatrices, telles que la plateforme MapR.

« Dans la Version 6.0, les capacités spécifiques de notre plateforme sont axées sur trois aspects essentiels du DataOps : automatisation du bon fonctionnement et de l’administration des clusters, sécurité et gouvernance des données, accélération de l’apprentissage automatique et de l’analytique. », commente Anoop Dawar, vice-président gestion et marketing produits de MapR. « DataOps est une évolution majeure, permettant aux entreprises de valoriser leurs données le plus rapidement possible. Nous ne cessons de faire évoluer la plateforme MapR afin de répondre aux besoins de tous ceux qui traitent des données : data scientists, personnel opérationnel, professionnels de la sécurité. »

Les principaux avantages de la Version 6.0 de la plateforme MapR :

● Automatisation du bon fonctionnement et de la sécurité de la plateforme. Pour garantir la bonne santé des clusters et la continuité de service, la plateforme MapR comprend désormais les fonctionnalités suivantes :

○ MapR Control System administre toutes les données (volumes, tables et flux) et surveille le bon fonctionnement des clusters en mettant en corrélation divers indicateurs.

○ Annoncée récemment, l’indexation de la base de données dans MapR-DB optimise la performance des applications tout en permettant le changement d’échelle (scalability) et la gestion automatiques des ressources.


● Rapidité et flexibilité de la capture des données. La fonction MapR Change Data Capture intègre la base de données MapR-DB avec MapR-ES. MapR-ES est une solution de streaming évènementiel qui capture les données en temps réel au moment de leur ingestion. MapR-DB, en association avec MapR-ES, permet une intégration simplifiée des données et permet à de multiples applications, y compris des modèles et des déploiements avancés de Machine Learning, de partager des informations et d'être synchronisées en temps réel.


● Sécurité et découvrabilité des données. Les utilisateurs des différents départements de l’entreprise doivent pouvoir trouver rapidement les données dont ils ont besoin ou qui pourraient leur être utiles pour leurs analyses, à la condition qu’ils disposent des droits d’accès appropriés pour ces données. La Version 6.0 offre de nouvelles fonctions de sécurité, pouvant être activées d’un simple clic, telles que l’authentification et un chiffrement sur le réseau, simplifiant énormément la configuration de la sécurité. MapR est plus simple à sécuriser dès le départ, ce qui contribue à réduire le risque de faille de sécurité.


● Data science et intelligence artificielle en libre-service. L’analyse des données repose de plus en plus sur l’apprentissage automatique et l’intelligence artificielle afin d’extraire rapidement des informations précises et exploitables. Les data scientists sont le moteur de l’approche DataOps. MapR a récemment annoncé sa nouvelle solution Data Science Refinery pour un accès complet, en libre-service, à toutes les données à partir du même cluster.


● Mise à jour de MapR Expansion Pack (MEP). MEP 4.0 comprend un nouveau conteneur MapR pour les développeurs, leur permettant de créer de nouvelles applications et services, ou de se former sur MapR. Elle comprend également le support pour la nouvelle version Apache Myriad 0.2 offrant des améliorations en matière de sécurité et la possibilité de gérer les appels Mesos, et un support étendu de Hive sur les tables MapR-DB JSON. Plus de détails sur MEP 4.0 sont disponibles ici.

« Les clients adoptant StreamSets Data Operating Platform cherchent régulièrement à mettre en œuvre des applications de capture de données modifiées [CDC, Change Data Capture] pour permettre la mise en place d’architectures pilotées par les événements », observe Kirit Basu, directeur produits de StreamSets. « Poursuivant notre collaboration déjà étroite avec l’équipe MapR, nous sommes très heureux d’y ajouter l’intégration de nouvelles capacités CDC dans MapR Converged Data Platform, apportant ainsi à notre clientèle conjointe un maximum de souplesse pour l’utilisation combinée de nos produits en vue de constituer des solutions complètes. »

Saket Saurabh, CEO de Nexla, plateforme DataOps pour les données interentreprises, commente : « DataOps est l’épine dorsale de toute entreprise pilotée par les données mais, trop souvent, nous manquons d’outils pour en faire un processus évolutif et reproductible. De fait, notre récente enquête auprès de 300 professionnels des données dans l’ensemble du secteur révèle que l’intégration, le dépannage, la création de pipelines de données et les opérations ETL [Extract-Transform-Load] prennent 47 % du temps des personnes interrogées. Ce temps précieux pourrait être consacré à l’analytique, prenant appui sur de nouveaux frameworks tels que l’apprentissage automatique. »

MapR Converged Data Platform 6.0 est disponible dès à présent. Les environnements cloud, tels Microsoft Azure, Amazon Web Services et Oracle Cloud, disposeront de la Version 6.0 d’ici la fin de l’année.



Dans la même rubrique :