Big Data, Science des données, aide à la décision en entreprise, business intelligence, data warehouse, reporting, OLAP, web analytics, data visualization, data mining, internet des objets, informatique cognitive, intelligence artificielle...

Abonnez-vous gratuitement à Decideo !


Decideo

 


MapR ajoute l’offre complète Apache Spark à sa distribution pour Hadoop


Rédigé par Communiqué de Mapr Technologies le 15 Avril 2014

Fournit un support 24/7 pour Spark avec Databricks et permet la conduite d’un plan d’actions et l’accélération de l’innovation sur Spark



MapR Technologies Inc., la première distribution pour Apache Hadoop, annonce son partenariat stratégique avec Databricks et l’ajout de la technologie Apache Spark à la distribution de MapR. Le système de mémoire interne Spark procure rapidité, facilité de programmation et les avantages du traitement en temps réel.
Matt Aslett, directeur de la recherche, des plateformes de données et de l’analytique chez 451 Research, souligne: « Apache Spark offre une combinaison de traitement de données de mémoire interne de haute performance et des modèles de calculs multiples. Elle sert comme la base des plateformes de traitement de données de nouvelle génération. Le support MapR pour l’offre Spark ajouté à son partenariat avec Databricks, donne confiance aux utilisateurs d’Hadoop qui devraient commencer à développer des applications afin de bénéficier de la performance et de la flexibilité de Spark ».
Les entreprises veulent tirer bénéfice de la valeur du big data plus facilement et plus rapidement. Spark améliore à la fois la performance et la productivité du développeur :
· Performance. Spark fournit une structure d’exécution universelle avec un acheminement de mémoire interne pour accélérer la performance d’application de bout en bout. Cela implique, pour de nombreuses applications, une amélioration de la performance de 5-100x.
· La productivité du développeur. Les tâches de Spark peuvent nécessiter seulement 1/5ème du nombre de lignes de code. Spark fournit une abstraction simple de programmation qui permet aux développeurs de concevoir des applications comme des opérations de collections de données (appelées RDD ou Données Distribuées Elastiques). Les développeurs peuvent construire ces applications dans des langages de programmation multiples, incluant Java, Scala et Python. Le même code peut être réutilisé dans des applications groupées, interactives et de streaming.
A l’heure actuelle, un grand nombre d’entreprises mettent Spark en production dans leur environnement MapR. Leurs applications basées sur Spark bénéficient d’une fiabilité de niveau entreprise et de la performance de la distribution MapR, mais aussi de l’aptitude à traiter en temps réel des données opérationnelles grâce à l’interface Direct Access NFS de MapR.
En incluant l’offre Stark dans la distribution MapR, les clients de MapR obtiennent un support 24/7 pour tous les projets Spark. De plus, MapR et Databricks unissent leurs forces pour conduire le projet et accélérer l’innovation. Cela profitera aux clients de MapR et à la communauté d’Hadoop ces prochaines années, à compter de la prochaine sortie de l’Apache Spark 1.0.
Ion Stoica, PDG de Databricks explique : « En tant que rôle moteur derrière Spark, Databricks est heureux de s’être engagé dans un tel partenariat stratégique avec MapR. Nous sommes impatients de combiner la fiabilité de MapR et la performance de Spark, le moteur big data de nouvelle génération, pour permettre aux entreprises de déverrouiller plus rapidement le contenu de leurs données».
John Schroeder, PDG et co-fondateur de MapR Technologies ajoute : « La communauté open-source développe rapidement de formidables innovations technologiques. MapR fournit un investissement d’avenir à ses clients avec la distribution la plus ouverte. Elle procure de la flexibilité afin de sélectionner la bonne solution avec la gamme la plus large de structures de calcul et de collection ».
L’offre Spark inclut cinq projets d’open source Apache. Avec l’intégration de l’offre complète Stark dans sa distribution, MapR inclut désormais plus de 20 projets d’open source Apache. Ces projets contiennent un large éventail de cas d’utilisation, y compris les lots, l’interaction, le streaming, le graphisme et le support machine. MapR est la seule distribution avec une cadence mensuelle de sorties pour les projets open source Apache. Les clients mettent ainsi à jour les composants de distribution sans mettre à jour le cluster entier. Cela permet également une adoption plus rapide de l’innovation open source tout en réduisant le risque d’interruption de la production des services de cluster.




Nouveau commentaire :
Facebook Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.